Часть 8. Функции агрегирования

Учебник QlikView (Qlik Sense). Часть 8. Функции агрегирования.

Содержание

Функции агрегирования. Общее

В данном разделе описаны функции, которые можно использовать в скриптах загрузки QlikView (и Qlik Sense) и выражениях диаграмм для агрегирования данных.

Многие функции можно использовать одинаковым образом как в скриптах загрузки данных, так и в выражениях диаграмм, но есть несколько исключений:

  • Некоторые функции можно использовать только в скриптах загрузки, это функции скрипта.
  • Некоторые функции можно использовать только в выражениях диаграммы, это функции диаграммы.
  • Некоторые функции можно использовать как в скриптах загрузки, так и в выражениях диаграмм, но существуют различия в параметрах и применении. Это описывается в отдельных темах, которые называются «Функции скрипта» или «Функции диаграммы».

Семейство функций, известных как функции агрегирования, состоит из функций, для которых несколько значений поля являются вводимым значением и которые возвращают один результат. В данных функциях агрегирование определяется измерением диаграммы или предложением group by в скрипте. В число функций агрегирования входят функции Sum(), Count(), Min(), Max() и многие другие.

Большинство функций агрегирования можно использовать как в скрипте загрузки, так и в выражениях диаграмм, но синтаксис имеет различия.

Использование функций агрегирования в скрипте загрузки

Функции агрегирования могут использоваться только с помощью операторов LOAD .

Использование функций агрегирования в выражениях диаграмм

Выражение аргумента одной функции агрегирования не должно содержать другую функцию агрегирования.

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Функция агрегирования агрегирует набор возможных записей, определенных выборкой. Однако альтернативное множество записей может быть определено выражением множества в анализе множеств.

Aggr — функция диаграммы

Функция Aggr() возвращает диапазон значений выражения, вычисленный по указанному измерению или измерениям. Например, максимальное значение продаж по каждому клиенту, по региону. Функция Aggr используется для расширенных агрегирований, в которых функция Aggr заключена в другую функцию агрегирования с помощью диапазона результатов, полученных из функции Aggr в качестве ввода в агрегирование, в которое она вложена.

Синтаксис:
Aggr({SetExpression}[DISTINCT] [NODISTINCT] expr, StructuredParameter{, StructuredParameter})

Тип возвращаемого значения: dual

Аргументы:

Аргумент Описание
expr

Выражение, состоящее из функции агрегирования. По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой.

StructuredParameter

StructuredParameter включает в себя измерение и, дополнительно, критерий сортировки в формате: (Dimension(Sort-type, Ordering))

Данное измерение представляет собой одиночное поле, оно не может быть выражением. Данное измерение используется для определения диапазона значений, для которого рассчитывается выражение Aggr.

Если критерии сортировки включены, будет вычислен диапазон значений, созданный функцией Aggr, вычисляемых для измерения. Это важно, когда порядок сортировки влияет на результат выражения, в котором заключена функция Aggr.

Сведения о порядке использования критериев сортировки см. в Добавление критериев сортировки в измерение в структурированном параметре.

SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если перед аргументом выражения стоит префикс distinct, или его вообще нет, то каждая комбинация значений измерений будет создавать только одно возвращаемое значение. Это обычный способ создания агрегирований — каждая комбинация значений измерений будет обозначаться одной линией на диаграмме.
NODISTINCT

Если перед аргументом выражения стоит префикс nodistinct, то каждая комбинация значений измерений может создавать несколько возвращаемых значений в зависимости от базовой структуры данных. Если измерение только одно, функция Aggr вернет массив с тем же количеством элементов, что и строк в исходных данных.

Базовые функции агрегирования, такие как Sum, Min и Avg, возвращают одно числовое значение, тогда как функцию Aggr() можно сравнить с созданием временного промежуточного результата (виртуальной таблицы), на основании которого выполняется другое агрегирование. Например, при вычислении среднего значения продаж посредством суммирования продаж по клиентам в операторе Aggr() и последующего вычисления среднего значения на основании результатов суммирования: Avg(TOTAL Aggr(Sum(Sales), Customer)).

Используйте функцию Aggr() в вычисляемых измерениях, если необходимо создать агрегирование вложенной диаграммы на различных уровнях.

Ограничения:

Каждое измерение в функции Aggr() может быть одиночным полем и не может быть выражением (вычисляемое измерение).

Добавление критериев сортировки в измерение в структурированном параметре

В начальной форме аргумент StructuredParameter в синтаксисе функции Aggr представляет собой отдельное измерение. Выражение: Aggr(Sum(Sales, Month)) дает общее значение продаж для каждого месяца. Однако при заключении в другую функцию агрегирования возможно получение непредвиденных результатов, если не будут использованы критерии сортировки. Причина заключается в том, что сортировка некоторых измерений может быть выполнена по числовому выражению или по алфавиту и т. д.

В аргументе StructuredParameter функции Aggr можно указать критерии сортировки для измерения в выражении. При этом применяется порядок сортировки для виртуальной таблицы, созданной функцией Aggr.

Аргумент StructuredParameter имеет следующий синтаксис:

(FieldName, (Sort-type, Ordering))

Структурированные параметры могут быть вложены:

(FieldName, (FieldName2, (Sort-type, Ordering)))

Тип сортировки может быть следующим: NUMERIC, TEXT, FREQUENCY или LOAD_ORDER.

Типы упорядочения, связанные с каждым типом сортировки, являются следующими:

Тип сортировки Допустимые типы упорядочения
NUMERIC ASCENDING, DESCENDING или REVERSE
TEXT ASCENDING, A2Z, DESCENDING, REVERSE или Z2A
FREQUENCY DESCENDING, REVERSE или ASCENDING
LOAD_ORDER ASCENDING, ORIGINAL, DESCENDING или REVERSE

Типы упорядочений REVERSE и DESCENDING эквивалентны.

Для типа сортировки TEXT эквивалентны типы упорядочения ASCENDING иA2Z, а также типы заказа DESCENDING, REVERSE и Z2A.

Для типа сортировки LOAD_ORDER эквивалентны типы упорядочения ASCENDING и ORIGINAL.

Примеры и результаты:
Пример Результат
Avg(Aggr(Sum(UnitSales*UnitPrice), Customer))

Выражение Aggr(Sum(UnitSales*UnitPrice), Customer) дает общее значение продаж по элементу Customer и возвращает диапазон значений: 295, 715 и 120 для трех значений элемента Customer.

Фактически, мы создали временный список значений без необходимости создания явной таблицы или столбца с этими значениями.

Данные значения используются в качестве вводных для функции Avg(), после чего вычисляется среднее значение продаж, равное 376,6667. (Необходимо выбрать значение Итоги для параметра Presentation на панели свойств.

Aggr(NODISTINCT Max(UnitPrice), Customer)

Диапазон значений: 16, 16, 16, 25, 25, 25, 19 и 19. Префикс nodistinct означает, что в диапазоне содержится один элемент для каждой строки в исходных данных: каждый является максимально допустимым UnitPrice для каждого Customer и Product.

max(aggr(sum(Customers)-above(Sum(Customers)), (MonthYear,(NUMERIC, ASCENDING))))

При использовании критериев сортировки в аргументе StructuredParameter в выражении:max(aggr(sum(Customers)-above(Sum(Customers)), (MonthYear,(NUMERIC, ASCENDING))))

Без критериев сортировки результат выражения max(aggr(sum(Customers)-above(Sum(Customers)), (MonthYear))) зависит от порядка сортировки измерения MonthYear. Возможно, желаемый результат не будет получен.

С помощью добавления в измерение значений типа сортировки и типа упорядочения мы задаем критерии сортировки для структурированного параметра: (MonthYear, (NUMERIC, ASCENDING)), где тип сортировки NUMERIC и заказа ASCENDING указывают, что сортировка MonthYear выполняется в возрастающем цифровом порядке.

Здесь мы стараемся определить максимальное возрастание количества клиентов из месяца в месяц. Данный метод подходит для использования в визуализации ключевого показателя эффективности.

В части Aggr выражения общее количество клиентов в месяц (заданное MonthYear) сравнивается с общим количеством предыдущего месяца.

Так как мы используем критерии сортировки с измерением: (MonthYear,(NUMERIC, ASCENDING)), мы уверены, что Aggr сравнивает количества клиентов в последовательных месяцах в виртуальной таблице путем упорядочивания месяцев в возрастающей цифровой последовательности, а не в возрастающем алфавитном порядке.

Данные, используемые в примерах:

Создайте таблицу с элементами Customer, Product, UnitPrice и UnitSales в качестве измерений. Добавьте выражение в таблицу в качестве меры.

ProductData:
LOAD * inline [
Customer|Product|UnitSales|UnitPrice
Astrida|AA|4|16
Astrida|AA|10|15
Astrida|BB|9|9
Betacab|BB|5|10
Betacab|CC|2|20
Betacab|DD|25|25
Canutility|AA|8|15
Canutility|CC||19
] (delimiter is '|');

Базовые функции агрегирования

Базовые функции агрегирования — это наиболее часто используемые функции агрегирования.

Пользуйтесь информацией из раскрывающегося списка по каждой функции, чтобы увидеть краткое описание и синтаксис каждой функции. Дополнительную информацию можно получить, если щелкнуть имя функции в описании синтаксиса.

Базовые функции агрегирования в скрипте загрузки
FirstSortedValue

Сортированные значения повторяются в количестве записей, как указано в предложении group by или агрегируются во всем наборе данных, если предложение group by не указано.

firstsorted([ distinct ] expression , sort-weight [, n ])

Max

Функция Max() находит наибольшее числовое значение агрегированных данных в выражении, как определено предложениемgroup by. Если указать rank n, можно найти наибольшее n-ное значение.

max( expression[, rank])

Min

Функция Min() возвращает наименьшее числовое значение агрегированных данных в выражении, как определено предложением group by. Если указать rank n, можно найти наименьшее n-ное значение.

min( expression[, rank])

Mode

Функция Mode() возвращает наиболее часто встречающееся значение, значение режима, агрегированных данных в выражении, как определено предложением group by. Функция Mode() может возвращать как числовые, так и текстовые значения.

mode(expression )

Only

Only() возвращает значение, если есть только один возможный результат, который может быть получен из агрегированных данных. Если запись в каждом сгруппированном результате, как определено предложением group by, содержит только одно значение, то возвращается это значение. В противном случае возвращается значение NULL.

only(expression )

Sum Функция Sum() вычисляет итоговое значение значений, агрегированных в выражении, как определено предложением group by.

sum([distinct]expression)

Базовые функции агрегирования в выражениях диаграмм

Функции агрегирования диаграммы могут использоваться только в полях выражений диаграммы. Выражение аргумента одной функции агрегирования не должно содержать другую функцию агрегирования.

FirstSortedValue

Функция FirstSortedValue() возвращает значение из выражения, указанного в элементе value, связанном с результатом сортировки аргумента sort_weight, учитывая элемент rank, если он указан. Если в результате больше одного значения имеют один и тот же элемент sort_weight для указанного элемента rank, функция возвращает значение NULL.

firstsortedvalue([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] value, sort_weight [,rank])

Max Max() находит наибольшее значение агрегированных данных. Если указать rank n, можно найти наибольшее n-ное значение.

max([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr [,rank])

Min

Min() находит наименьшее числовое значение агрегированных данных. Если указать rank n, можно найти наименьшее n-ное значение.

min([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr [,rank])

Mode

Mode() находит наиболее часто встречающееся значение, значение режима, в агрегированных данных. Функция Mode() может обрабатывать как числовые, так и текстовые значения.

mode({[SetExpression] [TOTAL [<fld {,fld}>]]} expr)

Only

Only() возвращает значение, если есть только один возможный результат, который может быть получен из агрегированных данных. Например, при поиске одного продукта, где стоимость единицы = 9, будет возвращено значение NULL, если стоимость единицы 9 есть у нескольких продуктов.

only([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr)

Sum

Sum() вычисляет итоговое значение, выданное выражением или полем, агрегированных данных.

sum([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr])

FirstSortedValue — функция скрипта

Функция FirstSortedValue() возвращает значение из выражения, указанного в элементе value, связанном с результатом сортировки аргумента sort_weight, учитывая элемент rank, если он указан. Если в результате больше одного значения имеют один и тот же элемент sort_weight для указанного элемента rank, функция возвращает значение NULL.

Сортированные значения повторяются в количестве записей, как указано в предложении group by или агрегируются во всем наборе данных, если предложение group by не указано.

Синтаксис:
FirstSortedValue ([ distinct ] value, sort-weight [, rank ])

Тип возвращаемого значения: dual

Аргументы:

Аргумент Описание
value Expression С помощью функции можно найти значение выражения value, которое соответствует результату сортировки поля sort_weight.
sort-weight Expression Выражение, содержащее данные для сортировки. Обнаружено первое (нижнее) значение элемента sort_weight, на основе которого определяется соответствующее значение выражения value. Если указать знак минуса перед элементом sort_weight, функция вернет последнее (самое высокое) отсортированное значение.
rank Expression

При указании для элемента rank значения «n» выше 1 будет получено n-ое отсортированное значение.

distinct

Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|CustomerID
Astrida|AA|1|10|1
Astrida|AA|7|18|1
Astrida|BB|4|9|1
Astrida|CC|6|2|1
Betacab|AA|5|4|2
Betacab|BB|2|5|2
Betacab|DD|12|25|2
Canutility|AA|3|8|3
Canutility|CC|13|19|3
Divadip|AA|9|16|4
Divadip|AA|10|16|4
Divadip|DD|11|10|4
] (delimiter is '|');

FirstSortedValue:
LOAD Customer,FirstSortedValue(Product, UnitSales) as MyProductWithSmallestOrderByCustomer Resident Temp Group By Customer;
Customer MyProductWithSmallestOrderByCustomer
Astrida CC
Betacab AA
Canutility AA
Divadip DD

Функция выполняет сортировку значений UnitSales от наименьших к наибольшим, регистрируя значение параметра Customer с наименьшим значением параметра UnitSales, как наименьший заказ.

В связи с этим элемент CC соответствует значению наименьшего заказа (значение параметра UnitSales=2) для клиента Astrida. Элемент AA соответствует наименьшему заказу (4) для клиента Betacab, элемент CC соответствует наименьшему заказу (8) для клиента Canutility, а элемент DD соответствует наименьшему заказу (10) для клиента Divadip.

При условии, что таблица Temp загружается, как в предыдущем примере:

LOAD Customer,FirstSortedValue(Product, -UnitSales) as MyProductWithLargestOrderByCustomer Resident Temp Group By Customer;
Customer MyProductWithLargestOrderByCustomer
Astrida AA
Betacab DD
Canutility CC
Divadip -

Аргументу sort_weight предшествует знак минуса, поэтому с помощью функции элементы будут отсортированы от наибольших к наименьшим.

Поскольку элемент AA соответствует наибольшему заказу (значение UnitSales:18) для клиента Astrida, элемент DD соответствует наибольшему заказу (12) для клиента Betacab, и элемент CC соответствует наибольшему заказу (13) для клиента Canutility. Существуют два одинаковых значения для наибольшего заказа (16) клиента Divadip, поэтому будет сформирован нулевой результат.

При условии, что таблица Temp загружается, как в предыдущем примере:

LOAD Customer,FirstSortedValue(distinct Product, UnitSales) as MyProductWithSmallestOrderByCustomer Resident Temp Group By Customer;
Customer MyProductWithLargestOrderByCustomer
Astrida AA
Betacab DD
Canutility CC
Divadip AA

Все действия будут выполняться так же, как и в предыдущем примере, но будет использоваться префикс distinct. При этом результат дубликата для Divadip будет проигнорирован, что позволит вернуть ненулевое значение.

FirstSortedValue — функция диаграммы

Функция FirstSortedValue() возвращает значение из выражения, указанного в элементе value, связанном с результатом сортировки аргумента sort_weight, учитывая элемент rank, если он указан. Если в результате больше одного значения имеют один и тот же элемент sort_weight для указанного элемента rank, функция возвращает значение NULL.

Синтаксис:
FirstSortedValue([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] value, sort_weight [,rank])

Тип возвращаемого значения: dual

Аргументы:

Аргумент Описание
value Поле вывода. С помощью функции можно найти значение выражения value, которое соответствует результату сортировки поля sort_weight.
sort_weight

Поле ввода. Выражение, содержащее данные для сортировки. Обнаружено первое (нижнее) значение элемента sort_weight, на основе которого определяется соответствующее значение выражения value. Если указать знак минуса перед элементом sort_weight, функция вернет последнее (самое высокое) отсортированное значение.

rank

При указании для элемента rank значения «n» выше 1 будет получено n-ое отсортированное значение.

SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Примеры и результаты:

Customer Product UnitSales UnitPrice
Astrida AA 4 16
Astrida AA 10 15
Astrida BB 9 9
Betacab BB 5 10
Betacab CC 2 20
Betacab DD - 25
Canutility AA 8 15
Canutility CC - 19

Пример Результат
firstsortedvalue (Product, UnitPrice)

Элемент BB, который является элементом Productс наименьшим значением UnitPrice(9).

firstsortedvalue (Product, UnitPrice, 2)

Элемент BB, который является элементом Product со вторым наименьшим значением UnitPrice(10).

firstsortedvalue (Customer, -UnitPrice, 2)

Элемент Betacab, который является Customer с Product со вторым наибольшим значением UnitPrice(20).

firstsortedvalue (Customer, UnitPrice, 3)

Значение NULL, поскольку существуют два значения элемента Customer (Astrida и Canutility) с одинаковым значениемrank (третьим наименьшим) UnitPrice(15).

Используйте префикс distinct, чтобы избежать непредвиденного появления значений NULL.

firstsortedvalue (Customer, -UnitPrice*UnitSales, 2)

Значение Canutility, которое является элементом Customer со вторым наибольшим значением порядка продажи UnitPrice, умноженным на элемент UnitSales (120).

Данные, используемые в примерах:

ProductData:
LOAD * inline [
Customer|Product|UnitSales|UnitPrice
Astrida|AA|4|16
Astrida|AA|10|15
Astrida|BB|9|9
Betacab|BB|5|10
Betacab|CC|2|20
Betacab|DD||25
Canutility|AA|8|15
Canutility|CC||19
] (delimiter is '|');

Max — функция скрипта

Функция Max() находит наибольшее числовое значение агрегированных данных в выражении, как определено предложениемgroup by. Если указать rank n, можно найти наибольшее n-ное значение.

Синтаксис:
Max ( expr [, rank])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
rank Expression

По умолчанию значение rank — 1, что соответствует наибольшему значению. При указании для rank значения 2 будет возвращено второе наибольшее значение. Если rank имеет значение 3, будет возвращено третье наибольшее значение, и т. д.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|CustomerID
Astrida|AA|1|10|1
Astrida|AA|7|18|1
Astrida|BB|4|9|1
Astrida|CC|6|2|1
Betacab|AA|5|4|2
Betacab|BB|2|5|2
Betacab|DD
Canutility|DD|3|8
Canutility|CC
] (delimiter is '|');

Max:
LOAD Customer, Max(UnitSales) as MyMax Resident Temp Group By Customer;

Customer

Astrida

Betacab

Canutility

MyMax

18

5

8

При условии, что таблица Temp загружается, как в предыдущем примере:

LOAD Customer, Max(UnitSales,2) as MyMaxRank2 Resident Temp Group By Customer;

Customer

Astrida

Betacab

Canutility

MyMaxRank2

10

4

-

Max — функция диаграммы

Max() находит наибольшее значение агрегированных данных. Если указать rank n, можно найти наибольшее n-ное значение.

Давайте также посмотрим на элементы FirstSortedValue и rangemax, которые имеют одинаковую функциональность в отношении функции Max.

Синтаксис:
Max([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr [,rank])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
rank По умолчанию значение rank — 1, что соответствует наибольшему значению. При указании для rank значения 2 будет возвращено второе наибольшее значение. Если rank имеет значение 3, будет возвращено третье наибольшее значение, и т. д.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Примеры и результаты:

Customer Product UnitSales UnitPrice
Astrida AA 4 16
Astrida AA 10 15
Astrida BB 9 9
Betacab BB 5 10
Betacab CC 2 20
Betacab DD - 25
Canutility AA 8 15
Canutility CC - 19

Примеры Результаты
Max(UnitSales) Значение 10, поскольку это наибольшее значение в элементе UnitSales.

Значение порядка вычисляется из числа проданных единиц в элементе (UnitSales), умноженного на стоимость единицы.

Max(UnitSales*UnitPrice)

Значение 150, поскольку это наибольшее значение, полученное в результате вычисления всех возможных значений элементов (UnitSales)*(UnitPrice).
Max(UnitSales, 2) Значение 9, которое является вторым наибольшим значением.
Max(TOTAL UnitSales) Значение 10, поскольку префикс TOTAL означает, что обнаружено наибольшее возможное значение без учета измерений диаграммы. Для диаграммы с элементом Customer в качестве измерения префикс TOTAL обеспечит возврат максимального значения по всему набору данных вместо максимального значения UnitSales для каждого клиента.

Выполнить выборку Customer B.

Max({1} TOTAL UnitSales)

Значение 10, независимо от сделанной выборки, поскольку выражение Set Analysis {1} определяет порядок записей для оценки в качестве элемента ALL, независимо от выборки.

Данные, используемые в примерах:

ProductData:
LOAD * inline [
Customer|Product|UnitSales|UnitPrice
Astrida|AA|4|16
Astrida|AA|10|15
Astrida|BB|9|9
Betacab|BB|5|10
Betacab|CC|2|20
Betacab|DD||25
Canutility|AA|8|15
Canutility|CC||19
] (delimiter is '|');

Min — функция скрипта

Функция Min() возвращает наименьшее числовое значение агрегированных данных в выражении, как определено предложением group by. Если указать rank n, можно найти наименьшее n-ное значение.

Синтаксис:
Min ( expr [, rank])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
rank Expression

Значение rank по умолчанию равно 1, что соответствует наименьшему значению. При указании для rank значения 2 будет возвращено второе наименьшее значение. Если rank имеет значение 3, будет возвращено третье наименьшее значение и т. д.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|CustomerID
Astrida|AA|1|10|1
Astrida|AA|7|18|1
Astrida|BB|4|9|1
Astrida|CC|6|2|1
Betacab|AA|5|4|2
Betacab|BB|2|5|2
Betacab|DD
Canutility|DD|3|8
Canutility|CC
] (delimiter is '|');

Min:
LOAD Customer, Min(UnitSales) as MyMin Resident Temp Group By Customer;

Customer

Astrida

Betacab

Canutility

MyMin

2

4

8

При условии, что таблица Temp загружается, как в предыдущем примере:

LOAD Customer, Min(UnitSales,2) as MyMinRank2 Resident Temp Group By Customer;

Customer

Astrida

Betacab

Canutility

MyMinRank2

9

5

-

Min — функция диаграммы

Min() находит наименьшее числовое значение агрегированных данных. Если указать rank n, можно найти наименьшее n-ное значение.

Давайте также посмотрим на элементы FirstSortedValue и rangemin, которые имеют одинаковую функциональность в отношении функции Min.

Синтаксис:
Min([{SetExpression}] [TOTAL [<fld {,fld}>]] expr [,rank])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
rank По умолчанию значение rank — 1, что соответствует наибольшему значению. При указании для rank значения 2 будет возвращено второе наибольшее значение. Если rank имеет значение 3, будет возвращено третье наибольшее значение, и т. д.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Примеры и результаты:

Customer Product UnitSales UnitPrice
Astrida AA 4 16
Astrida AA 10 15
Astrida BB 9 9
Betacab BB 5 10
Betacab CC 2 20
Betacab DD - 25
Canutility AA 8 15
Canutility CC - 19

Функция Min() должна возвращать значение, не являющееся NULL, из диапазона значений, обеспеченных выражением, если таковое имеется. Таким образом, поскольку в данных имеются значения NULL, функция возвращает первое значение, не являющееся NULL, оцененное из выражения.

Примеры Результаты
Min(UnitSales) Значение 2, поскольку это наименьшее значение, не являющееся NULL, в элементе UnitSales.

Значение порядка вычисляется из числа проданных единиц в элементе (UnitSales), умноженного на стоимость единицы.

Min(UnitSales*UnitPrice)
Значение 40, поскольку это наименьшее значение, не являющееся NULL, полученное в результате вычисления всех возможных значений элементов (UnitSales)*(UnitPrice).
Min(UnitSales, 2) Значение 4, которое является вторым наименьшим значением (после значений NULL).
Min(TOTAL UnitSales) Значение 2, поскольку префикс TOTAL означает, что обнаружено наименьшее возможное значение без учета измерений диаграммы. Для диаграммы с элементом Customer в качестве измерения префикс TOTAL обеспечит возврат минимального значения по всему набору данных вместо минимального значения UnitSales для каждого клиента.

Выполнить выборкуCustomer B.

Min({1} TOTAL UnitSales)
Значение 40, независимо от сделанной выборки, поскольку выражение Set Analysis {1} определяет порядок записей для оценки в качестве элемента ALL, независимо от выборки.

Данные, используемые в примерах:

ProductData:
LOAD * inline [
Customer|Product|UnitSales|UnitPrice
Astrida|AA|4|16
Astrida|AA|10|15
Astrida|BB|9|9
Betacab|BB|5|10
Betacab|CC|2|20
Betacab|DD||25
Canutility|AA|8|15
Canutility|CC||19
] (delimiter is '|');

Mode — функция скрипта

Функция Mode() возвращает наиболее часто встречающееся значение, значение режима, агрегированных данных в выражении, как определено предложением group by. Функция Mode() может возвращать как числовые, так и текстовые значения.

Синтаксис:
Mode ( expr )

Тип возвращаемого значения: dual

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.

Ограничения:

Если одинаково часто встречаются несколько значений, возвращается значение NULL.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|CustomerID
Astrida|AA|1|10|1
Astrida|AA|7|18|1
Astrida|BB|4|9|1
Astrida|CC|6|2|1
Betacab|AA|5|4|2
Betacab|BB|2|5|2
Betacab|DD
Canutility|DD|3|8
Canutility|CC
] (delimiter is '|');

Mode:
LOAD Customer, Mode(Product) as MyMostOftenSoldProduct Resident Temp Group By Customer;

Customer, MyMostOftenSoldProduct

Astrida, AA

Betacab, -

Canutility, -

Mode — функция диаграммы

Mode() находит наиболее часто встречающееся значение, значение режима, в агрегированных данных. Функция Mode() может обрабатывать как числовые, так и текстовые значения.

Синтаксис:
Mode([{SetExpression}] [TOTAL [<fld {,fld}>]] expr)

Тип возвращаемого значения: dual

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Примеры и результаты:

Customer Product UnitSales UnitPrice
Astrida AA 4 16
Astrida AA 10 15
Astrida BB 9 9
Betacab BB 5 10
Betacab CC 2 20
Betacab DD - 25
Canutility AA 8 15
Canutility CC - 19

Примеры Результаты
Mode(UnitPrice)

Выполнить выборкуCustomer A.

Значение 15, поскольку это наиболее часто встречающееся значение в элементе UnitSales.

Возвращает NULL (-). Одно значение встречается не чаще, чем другое.

Mode(Product)

Выполните выборкуCustomer A.

Значение AA, поскольку это наиболее часто встречающееся значение в элементе Product.

Возвращает NULL (-). Одно значение встречается не чаще, чем другое.

Mode(TOTAL UnitPrice) Значение 15, поскольку префикс TOTAL означает, что наиболее часто встречающимся значением все еще является 15, без учета измерений диаграммы.

Выполните выборку Customer B.

Mode)({1} TOTAL UnitPrice)
Значение 15, независимо от сделанной выборки, поскольку выражение Set Analysis {1} определяет порядок записей для оценки в качестве элемента ALL, независимо от выборки.

Данные, используемые в примерах:

ProductData:
LOAD * inline [
Customer|Product|UnitSales|UnitPrice
Astrida|AA|4|16
Astrida|AA|10|15
Astrida|BB|9|9
Betacab|BB|5|10
Betacab|CC|2|20
Betacab|DD||25
Canutility|AA|8|15
Canutility|CC||19
] (delimiter is '|');

Only — функция скрипта

Only() возвращает значение, если есть только один возможный результат, который может быть получен из агрегированных данных. Если запись в каждом сгруппированном результате, как определено предложением group by, содержит только одно значение, то возвращается это значение. В противном случае возвращается значение NULL.

Синтаксис:
Only ( expr )

Тип возвращаемого значения: dual

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|CustomerID
Astrida|AA|1|10|1
Astrida|AA|7|18|1
Astrida|BB|4|9|1
Astrida|CC|6|2|1
Betacab|AA|5|4|2
Betacab|BB|2|5|2
Betacab|DD
Canutility|DD|3|8
Canutility|CC
] (delimiter is '|');

Only:
LOAD Customer, Only(CustomerID) as MyUniqIDCheck Resident Temp Group By Customer;

Customer

Astrida

MyUniqIDCheck

1

поскольку только у клиента Astrida записи заполнены и включают элемент CustomerID.

Only — функция диаграммы

Only() возвращает значение, если есть только один возможный результат, который может быть получен из агрегированных данных. Например, при поиске одного продукта, где стоимость единицы = 9, будет возвращено значение NULL, если стоимость единицы 9 есть у нескольких продуктов.

Синтаксис:
Only([{SetExpression}] [TOTAL [<fld {,fld}>]] expr)

Тип возвращаемого значения: dual

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Используйте функцию Only(), если необходимо получить значение NULL в случае нескольких возможных значений в данных образца.

Примеры и результаты:

Customer Product UnitSales UnitPrice
Astrida AA 4 16
Astrida AA 10 15
Astrida BB 9 9
Betacab BB 5 10
Betacab CC 2 20
Betacab DD - 25
Canutility AA 8 15
Canutility CC - 19

Примеры Результаты
Only({<UnitPrice={9}>} Product) Значение BB, поскольку это единственный элемент Product, у которого элемент UnitPrice равен 9.
Only({<Product={DD}>} Customer) Значение Betacab, поскольку это единственный элемент Customer, продающий Product под названием «DD».
Only({<UnitPrice={20}>} UnitSales) Число элементов UnitSales, где элемент UnitPrice, равный 20, составляет 2, поскольку есть только одно значение элемента UnitSales, где UnitPrice = 20.
Only({<UnitPrice={15}>} UnitSales) Значение NULL, поскольку существуют два значения элемента UnitSales, где UnitPrice = 15.

Данные, используемые в примерах:

ProductData:
LOAD * inline [
Customer|Product|UnitSales|UnitPrice
Astrida|AA|4|16
Astrida|AA|10|15
Astrida|BB|9|9
Betacab|BB|5|10
Betacab|CC|2|20
Betacab|DD||25
Canutility|AA|8|15
Canutility|CC||19
] (delimiter is '|');

Sum — функция скрипта

Функция Sum() вычисляет итоговое значение значений, агрегированных в выражении, как определено предложением group by.

Синтаксис:
sum ( [ distinct] expr)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
distinct Если слово DISTINCT указано перед выражением, все дубликаты будут проигнорированы.
expr Выражение или поле, содержащее данные для измерения.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|CustomerID
Astrida|AA|1|10|1
Astrida|AA|7|18|1
Astrida|BB|4|9|1
Astrida|CC|6|2|1
Betacab|AA|5|4|2
Betacab|BB|2|5|2
Betacab|DD
Canutility|DD|3|8
Canutility|CC
] (delimiter is '|');

Sum:
LOAD Customer, Sum(UnitSales) as MySum Resident Temp Group By Customer;

Customer

Astrida

Betacab

Canutility

MySum

39

9

8

Sum — функция диаграммы

Sum() вычисляет итоговое значение, выданное выражением или полем, агрегированных данных.

Синтаксис:
Sum([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
Несмотря на то, что префикс DISTINCT поддерживается, используйте его чрезвычайно осторожно, поскольку его использование может ввести в заблуждение — читатель может подумать, что показано итоговое значение, в то время как некоторые данные опущены.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Примеры и результаты:

Customer Product UnitSales UnitPrice
Astrida AA 4 16
Astrida AA 10 15
Astrida BB 9 9
Betacab BB 5 10
Betacab CC 2 20
Betacab DD - 25
Canutility AA 8 15
Canutility CC - 19

Примеры Результаты
Sum(UnitSales)

38. Итого значений в элементе UnitSales.

Sum(UnitSales*UnitPrice)

505. Итого элемента UnitPrice, умноженное на агрегированный элемент UnitSales.

Sum(TOTAL UnitSales*UnitPrice) Значение 505 для всех строк в таблице, а также итоговое значение, поскольку префикс TOTAL означает, что сумма по-прежнему равна 505, без учета измерений диаграммы.

Выполните выборку Customer B.

Sum({1} TOTAL UnitSales*UnitPrice)
Значение 505, независимо от сделанной выборки, поскольку выражение Set Analysis {1} определяет порядок записей для оценки в качестве элемента ALL, независимо от выборки.

Данные, используемые в примерах:

ProductData:
LOAD * inline [
Customer|Product|UnitSales|UnitPrice
Astrida|AA|4|16
Astrida|AA|10|15
Astrida|BB|9|9
Betacab|BB|5|10
Betacab|CC|2|20
Betacab|DD||25
Canutility|AA|8|15
Canutility|CC||19
] (delimiter is '|');

Функции агрегирования счетчика

Функции агрегирования счетчика возвращают различные типы счетчиков выражения для ряда записей в скрипте загрузки или ряда значений в измерении диаграммы.

Пользуйтесь информацией из раскрывающегося списка по каждой функции, чтобы увидеть краткое описание и синтаксис каждой функции. Дополнительную информацию можно получить, если щелкнуть имя функции в описании синтаксиса.

Функции агрегирования счетчика в скрипте загрузки
Count

Функция Count() возвращает число значений, агрегированных в выражении, как определено предложением group by.

count([ distinct ] expression)

MissingCount

Функция MissingCount() возвращает число отсутствующих значений, агрегированных в выражении, как определено предложением group by.

MissingCount([ distinct ] expression)

NullCount

Функция NullCount() возвращает число значений NULL, агрегированных в выражении, как определено предложением group by.

NullCount([ distinct ] expression)

NumericCount

Функция NumericCount() возвращает число числовых значений, найденных в выражении, как определено предложением group by.

NumericCount([ distinct ] expression)

TextCount

Функция TextCount() возвращает число нечисловых значений поля, агрегированных в выражении, как определено предложением group by.

TextCount([ distinct ] expression)

Функции агрегирования счетчика в выражениях диаграмм

Следующие функции агрегирования счетчика можно использовать в диаграммах:

Count

Count() используется для агрегирования текстовых и числовых значений в каждом измерении диаграммы.

count([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr)

MissingCount

MissingCount() используется для агрегирования отсутствующих значений в каждом измерении диаграммы. Отсутствующие значения — это все нечисловые значения.

missingcount([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr)

NullCount

NullCount() используется для агрегирования значений NULL в каждом измерении диаграммы.

nullcount([{SetExpression}][DISTINCT] [TOTAL [<fld {,fld}>]] expr)

NumericCount

NumericCount() используется для агрегирования числовых значений в каждом измерении диаграммы.

numericcount([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr)

TextCount

TextCount() используется для агрегирования нечисловых значений поля в каждом измерении диаграммы.

textcount([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr)

Count — функция скрипта

Функция Count() возвращает число значений, агрегированных в выражении, как определено предложением group by.

Синтаксис:
Count( [ distinct ] expr)

Тип возвращаемого значения: целое число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
distinct Если слово distinct указано перед выражением, все дубликаты будут проигнорированы.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|UnitPrice
Astrida|AA|1|4|16
Astrida|AA|7|10|15
Astrida|BB|4|9|9
Betacab|CC|6|5|10
Betacab|AA|5|2|20
Betacab|BB|1|25| 25
Canutility|AA|3|8|15
Canutility|CC|||19
Divadip|CC|2|4|16
Divadip|DD|3|1|25
] (delimiter is '|');

Count1:
LOAD Customer,Count(OrderNumber) as OrdersByCustomer Resident Temp Group By Customer;

Customer OrdersByCustomer
Astrida 3
Betacab 3
Canutility 2
Divadip 2

При условии, что измерение Customer включено в таблицу на листе, в противном случае результатом для OrdersByCustomer будет 3, 2.

При условии, что таблица Temp загружается, как в предыдущем примере:

TotalOrderNumber
10

При условии, что таблица Temp загружается, как в первом примере:

LOAD Count(distinct OrderNumber) as TotalOrderNumber Resident Temp;
TotalOrderNumber
9

Поскольку существуют два значения элемента OrderNumber с одинаковым значением (1).

Count — функция диаграммы

Count() используется для агрегирования текстовых и числовых значений в каждом измерении диаграммы.

Синтаксис:
Count([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr)

Тип возвращаемого значения: целое число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Примеры и результаты:

Customer Product OrderNumber UnitSales Unit Price
Astrida AA 1 4 16
Astrida AA 7 10 15
Astrida BB 4 9 9
Betacab BB 6 5 10
Betacab CC 5 2 20
Betacab DD 1 25 25
Canutility AA 3 8 15
Canutility CC 19
Divadip AA 2 4 16
Divadip DD 3 25

В следующих примерах считается, что все клиенты выбраны, если не указано иначе.

Пример Результат
Count(OrderNumber)

10, поскольку существует 10 полей, которые могут иметь значение для элемента OrderNumber, а также учитываются все записи, даже пустые.

«0» считается значением, а не пустой ячейкой. Тем не менее, если мера агрегирует значение для измерения до 0, это измерение не будет включено в диаграммы.

Count (Customer) Значение 10, поскольку элемент Count оценивает число вхождений во всех полях.
Count (DISTINCT [Customer]) Значение 4, поскольку при использовании префикса Distinct, элемент Count оценивает только уникальные вхождения.

При условии выбора клиента Canutility

Count (OrderNumber)/Count ({1} TOTAL OrderNumber
Значение 0,2, поскольку выражение возвращает число заказов выбранного клиента в виде процентного соотношения заказов всех клиентов. В этом случае 2 / 10.

При условии выбора клиентов Astrida и Canutility

Count(TOTAL <Product> OrderNumber)
Значение 5, поскольку это число заказов, размещенных для продуктов только выбранных клиентов, пустые ячейки учитываются.

Данные, используемые в примерах:

Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|UnitPrice
Astrida|AA|1|4|16
Astrida|AA|7|10|15
Astrida|BB|4|9|9
Betacab|CC|6|5|10
Betacab|AA|5|2|20
Betacab|BB|1|25| 25
Canutility|AA|3|8|15
Canutility|CC|||19
Divadip|CC|2|4|16
Divadip|DD|3|1|25
] (delimiter is '|');

MissingCount — функция скрипта

Функция MissingCount() возвращает число отсутствующих значений, агрегированных в выражении, как определено предложением group by.

Синтаксис:
MissingCount ( [ distinct ] expr)

Тип возвращаемого значения: целое число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
distinct Если слово distinct указано перед выражением, все дубликаты будут проигнорированы.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|UnitPrice
Astrida|AA|1|4|16
Astrida|AA|7|10|15
Astrida|BB|4|9|9
Betacab|CC|6|5|10
Betacab|AA|5|2|20
Betacab|BB||| 25
Canutility|AA|||15
Canutility|CC| ||19
Divadip|CC|2|4|16
Divadip|DD|3|1|25
] (delimiter is '|');
MissCount1:
LOAD Customer,MissingCount(OrderNumber) as MissingOrdersByCustomer Resident Temp Group By Customer;

Load MissingCount(OrderNumber) as TotalMissingCount Resident Temp;

Customer MissingOrdersByCustomer
Astrida 0
Betacab 1
Canutility 2
Divadip 0

Второй оператор дает следующее:

TotalMissingCount
3

в таблице с этим измерением.

При условии, что таблица Temp загружается, как в предыдущем примере:

LOAD MissingCount(distinct OrderNumber) as TotalMissingCountDistinct Resident Temp;
TotalMissingCountDistinct
1

Поскольку одним отсутствующим значением является только один элемент OrderNumber.

MissingCount — функция диаграммы

MissingCount() используется для агрегирования отсутствующих значений в каждом измерении диаграммы. Отсутствующие значения — это все нечисловые значения.

Синтаксис:
MissingCount([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr)

Тип возвращаемого значения: целое число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Примеры и результаты:

Customer Product OrderNumber UnitSales Unit Price
Astrida AA 1 4 16
Astrida AA 7 10 15
Astrida BB 4 9 9
Betacab BB 6 5 10
Betacab CC 5 2 20
Betacab DD 25
Canutility AA 15
Canutility CC 19
Divadip AA 2 4 16
Divadip DD 3 25

Пример Результат
MissingCount([OrderNumber])

Значение 3, поскольку 3 из 10 полей OrderNumber являются пустыми

«0» считается значением, а не пустой ячейкой. Тем не менее, если мера агрегирует значение для измерения до 0, это измерение не будет включено в диаграммы.
MissingCount ([OrderNumber])/MissingCount ({1} Total [OrderNumber]) Выражение возвращает число невыполненных заказов выбранного клиента в виде доли невыполненных заказов всех клиентов. Всего 3 отсутствующих значения для поля OrderNumber для всех клиентов. Таким образом, для каждого элемента Customer, имеющего отсутствующее значение для элемента Product, результатом будет 1/3.

Данные, используемые в примере:

Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|UnitPrice
Astrida|AA|1|4|16
Astrida|AA|7|10|15
Astrida|BB|4|9|9
Betacab|CC|6|5|10
Betacab|AA|5|2|20
Betacab|BB||| 25
Canutility|AA|||15
Canutility|CC| ||19
Divadip|CC|2|4|16
Divadip|DD|3|1|25
] (delimiter is '|');

NullCount — функция скрипта

Функция NullCount() возвращает число значений NULL, агрегированных в выражении, как определено предложением group by.

Синтаксис:
NullCount ( [ DISTINCT ] expr)

Тип возвращаемого значения: целое число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
distinct Если слово DISTINCT указано перед выражением, все дубликаты будут проигнорированы.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Set NULLINTERPRET = NULL;
Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|CustomerID
Astrida|AA|1|10|1
Astrida|AA|7|18|1
Astrida|BB|4|9|1
Astrida|CC|6|2|1
Betacab|AA|5|4|2
Betacab|BB|2|5|2
Betacab|DD|||
Canutility|AA|3|8|
Canutility|CC|NULL||
] (delimiter is '|');
Set NULLINTERPRET=;
NullCount1:
LOAD Customer,NullCount(OrderNumber) as NullOrdersByCustomer Resident Temp Group By Customer;

LOAD NullCount(OrderNumber) as TotalNullCount Resident Temp;
Customer NullOrdersByCustomer
Astrida 0
Betacab 0
Canutility 1

Второй оператор дает следующее:

TotalNullCount
1

в таблице с этим измерением, поскольку единственная запись содержит нулевое значение.

NullCount — функция диаграммы

NullCount() используется для агрегирования значений NULL в каждом измерении диаграммы.

Синтаксис:
NullCount([{SetExpression}][DISTINCT] [TOTAL [<fld {,fld}>]] expr)

Тип возвращаемого значения: целое число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Примеры и результаты:

Пример Результат
NullCount([OrderNumber]) Значение 1, поскольку введено нулевое значение с помощью элемента NullInterpret во встроенном операторе LOAD.

Данные, используемые в примере:

Set NULLINTERPRET = NULL;
Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|CustomerID
Astrida|AA|1|10|1
Astrida|AA|7|18|1
Astrida|BB|4|9|1
Astrida|CC|6|2|1
Betacab|AA|5|4|2
Betacab|BB|2|5|2
Betacab|DD|||
Canutility|AA|3|8|
Canutility|CC|NULL||
] (delimiter is '|');
Set NULLINTERPRET=;

NumericCount — функция скрипта

Функция NumericCount() возвращает число числовых значений, найденных в выражении, как определено предложением group by.

Синтаксис:
NumericCount ( [ DISTINCT ] expr)

Тип возвращаемого значения: целое число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
distinct Если слово DISTINCT указано перед выражением, все дубликаты будут проигнорированы.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|UnitPrice
Astrida|AA|1|4|16
Astrida|AA|7|10|15
Astrida|BB|4|9|9
Betacab|CC|6|5|10
Betacab|AA|5|2|20
Betacab|BB||| 25
Canutility|AA|||15
Canutility|CC| ||19
Divadip|CC|2|4|16
Divadip|DD|7|1|25
] (delimiter is '|');
NumCount1:
LOAD Customer,NumericCount(OrderNumber) as NumericCountByCustomer Resident Temp Group By Customer;

Customer
Astrida
Betacab
Canutility
Divadip
NumericCountByCustomer
3
2
0
2
LOAD NumericCount(OrderNumber) as TotalNumericCount Resident Temp; Второй оператор дает следующее:
TotalNumericCount
7

При условии, что таблица Temp загружается, как в предыдущем примере:

LOAD NumericCount(distinct OrderNumber) as TotalNumericCountDistinct Resident Temp;
TotalNumericCountDistinct
6
Поскольку существует один элемент OrderNumber , который дублирует другой элемент, результатом будет значение 6. Эти элементы не являются дубликатами.

NumericCount — функция диаграммы

NumericCount() используется для агрегирования числовых значений в каждом измерении диаграммы.

Синтаксис:
NumericCount([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr)

Тип возвращаемого значения: целое число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Примеры и результаты:

Customer Product OrderNumber UnitSales Unit Price
Astrida AA 1 4 16
Astrida AA 7 10 15
Astrida BB 4 9 1
Betacab BB 6 5 10
Betacab CC 5 2 20
Betacab DD 25
Canutility AA 15
Canutility CC 19
Divadip AA 2 4 16
Divadip DD 3 25

В следующих примерах считается, что все клиенты выбраны, если не указано иначе.

Пример Результат
NumericCount([OrderNumber])

Значение 7, поскольку 3 из 10 полей в элементе OrderNumber пустые.

«0» считается значением, а не пустой ячейкой. Тем не менее, если мера агрегирует значение для измерения до 0, это измерение не будет включено в диаграммы.

NumericCount([Product]) Значение 0, поскольку все имена продуктов указаны в тексте. Обычно данную операцию можно использовать, чтобы убедиться, что в текстовых полях нет числового содержимого.
NumericCount (DISTINCT [OrderNumber])/Count(DISTINCT [OrderNumber]) Подсчитывается количество всех уникальных числовых заказов и делится по количеству числовых и не числовых заказов. Если все значения полей числовые, это значение будет равно 1. Обычно данный способ можно использовать, чтобы убедиться, что все значения в полях числовые. В этом примере имеется 7 уникальных числовых значений для элемента OrderNumber из 8 уникальных числовых и нечисловых значений, поэтому выражение возвращает 0,875.

Данные, используемые в примере:

Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|UnitPrice
Astrida|AA|1|4|16
Astrida|AA|7|10|15
Astrida|BB|4|9|9
Betacab|CC|6|5|10
Betacab|AA|5|2|20
Betacab|BB||| 25
Canutility|AA|||15
Canutility|CC| ||19
Divadip|CC|2|4|16
Divadip|DD|3|1|25
] (delimiter is '|');

TextCount — функция скрипта

Функция TextCount() возвращает число нечисловых значений поля, агрегированных в выражении, как определено предложением group by.

Синтаксис:
TextCount ( [ DISTINCT ] expr)

Тип возвращаемого значения: целое число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
distinct Если слово DISTINCT указано перед выражением, все дубликаты будут проигнорированы.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|UnitPrice
Astrida|AA|1|4|16
Astrida|AA|7|10|15
Astrida|BB|4|9|9
Betacab|CC|6|5|10
Betacab|AA|5|2|20
Betacab|BB||| 25
Canutility|AA|||15
Canutility|CC| ||19
Divadip|CC|2|4|16
Divadip|DD|3|1|25
] (delimiter is '|');
TextCount1:
LOAD Customer,TextCount(Product) as ProductTextCount Resident Temp Group By Customer;
Customer
Astrida
Betacab
Canutility
Divadip
ProductTextCount
3
3
2
2

LOAD Customer,TextCount(OrderNumber) as OrderNumberTextCount Resident Temp Group By Customer;
Customer
Astrida
Betacab
Canutility
Divadip
OrderNumberTextCount
0
1
2
0

TextCount — функция диаграммы

TextCount() используется для агрегирования нечисловых значений поля в каждом измерении диаграммы.

Синтаксис:
TextCount([{SetExpression}] [DISTINCT] [TOTAL [<fld {,fld}>]] expr)

Тип возвращаемого значения: целое число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Примеры и результаты:

Customer Product OrderNumber UnitSales Unit Price
Astrida AA 1 4 16
Astrida AA 7 10 15
Astrida BB 4 9 1
Betacab BB 6 5 10
Betacab CC 5 2 20
Betacab DD 25
Canutility AA 15
Canutility CC 19
Divadip AA 2 4 16
Divadip DD 3 25

Пример Результат
TextCount([Product])

Значение 10, поскольку все из 10 полей в элементе Product текстовые.

«0» считается значением, а не пустой ячейкой. Тем не менее, если мера агрегирует значение для измерения до 0, это измерение не будет включено в диаграммы.
TextCount([OrderNumber]) Значение 3, поскольку пустые ячейки учитываются. Обычно используется, чтобы убедиться, что в числовых полях нет текстовых значений.

Данные, используемые в примере:

Temp:
LOAD * inline [
Customer|Product|OrderNumber|UnitSales|UnitPrice
Astrida|AA|1|4|16
Astrida|AA|7|1|15
Astrida|BB|4|9|9
Betacab|CC|6|5|10
Betacab|AA|5|2|20
Betacab|BB|||| 25
Canutility|AA|||15
Canutility|CC|||19
Divadip|CC|2|4|16
Divadip|DD|3|1|25
] (delimiter is '|');

Функции финансового агрегирования

В этом разделе описаны функции агрегирования для финансовых операций в отношении платежей и денежного потока.

Пользуйтесь информацией из раскрывающегося списка по каждой функции, чтобы увидеть краткое описание и синтаксис каждой функции. Дополнительную информацию можно получить, если щелкнуть имя функции в описании синтаксиса.

Функции финансового агрегирования в скрипте загрузки
IRR

Функция IRR() возвращает агрегированную внутреннюю ставку доходов для серии потоков денежных средств, представленных числами выражений, повторяемых в нескольких записях так, как это определено предложением group by.

IRR(expression)

XIRR

Функция XIRR() возвращает агрегированную внутреннюю ставку доходов для графика потоков денежных средств (не обязательно регулярных), представленных парными числами в элементах pmt и date, повторяемых в нескольких записях так, как это определено предложением group by. Все платежи учитываются на основе года с 365 днями.

XIRR(pmt, date)

NPV

NPV() возвращает агрегированную чистую текущую стоимость вложения на основе константы discount_rate за период и ряда будущих платежей (отрицательные значения) и поступлений (положительные значения), представленных числами в элементе value, повторяемом в нескольких записях так, как это определено предложением group by. Предполагается, что платежи и поступления происходят в конце каждого периода.

NPV(discount_rate, value)

XNPV

Функция XNPV() возвращает агрегированную чистую текущую стоимость для графика потоков денежных средств (не обязательно регулярных), представленных парными числами в элементах pmt и date, повторяемых в нескольких записях так, как это определено предложением group by. Rate — это процентная ставка за период. Все платежи учитываются на основе года с 365 днями.

XNPV(discount_rate, pmt, date)

Функции финансового агрегирования в выражениях диаграмм

Эти функции финансового агрегирования можно использовать в диаграммах.

IRR

IRR() возвращает агрегированную внутреннюю ставку доходов для серии потоков денежных средств, представленных числами в выражении, выданном элементом value, повторяемом в измерениях диаграммы.

irr([TOTAL [<fld {,fld}>]] value)

NPV

Функция NPV() возвращает агрегированную чистую стоимость инвестиций на основе скидки discount_rate за период, серии будущих платежей (отрицательные значения) и дохода (положительные значения), представленных числами в элементе value, повторяемом в измерениях диаграммы. Предполагается, что платежи и поступления происходят в конце каждого периода.

npv([TOTAL [<fld {,fld}>]] discount_rate, value)

XIRR

XIRR() возвращает агрегированную внутреннюю ставку доходов для графика потоков денежных средств (не обязательно периодических), представленных парными числами в выражениях, выданных элементами pmt и date, повторяемыми в измерениях диаграммы. Все платежи учитываются на основе года с 365 днями.

XIRR — функция диаграммы([TOTAL [<fld {,fld}>]] pmt, date)

XNPV

XNPV() возвращает агрегированную чистую стоимость для графика потоков денежных средств (не обязательно периодических), представленных парными числами в выражениях, выданных элементами pmt и date, повторяемыми в измерениях диаграммы. Все платежи учитываются на основе года с 365 днями.

xnpv([TOTAL [<fld{,fld}>]] discount_rate, pmt, date)

IRR — функция скрипта

Функция IRR() возвращает агрегированную внутреннюю ставку доходов для серии потоков денежных средств, представленных числами выражений, повторяемых в нескольких записях так, как это определено предложением group by.

Эти потоки денежных средств не обязаны быть равномерными, как ежегодные платежи. Однако потоки денежных средств должны осуществляться с регулярными интервалами, например ежемесячно или ежегодно. Внутренняя ставка доходов является процентной ставкой, полученной по вложению и состоящей из платежей (отрицательные значения) и поступлений (положительные значения), которые происходят в равные промежутки. Для вычисления функции необходимо не менее одного отрицательного и одного положительного значений.

Синтаксис:
IRR(value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выражение или поле, содержащее данные для измерения.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения игнорируются.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Примеры и результаты:

Пример Результат
Cashflow:
LOAD 2013 as Year, * inline [
Date|Discount|Payments
2013-01-01|0.1|-10000
2013-03-01|0.1|3000
2013-10-30|0.1|4200
2014-02-01|0.2|6800
] (delimiter is '|');

Cashflow1:
LOAD Year,IRR(Payments) as IRR2013 Resident Cashflow Group By Year;

Year

2013

IRR2013

0.1634

IRR — функция диаграммы

IRR() возвращает агрегированную внутреннюю ставку доходов для серии потоков денежных средств, представленных числами в выражении, выданном элементом value, повторяемом в измерениях диаграммы.

Эти потоки денежных средств не обязаны быть равномерными, как ежегодные платежи. Однако потоки денежных средств должны осуществляться с регулярными интервалами, например ежемесячно или ежегодно. Внутренняя ставка доходов — это процентная ставка для инвестиций, состоящих из платежей (отрицательные значения) и дохода (положительные значения), осуществляемых регулярно. Для вычисления этой функции необходимо по крайней мере одно положительное и одно отрицательное значение.

Синтаксис:
IRR([TOTAL [<fld {,fld}>]] value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выражение или поле, содержащее данные для измерения.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения игнорируются.

Примеры и результаты:

Пример Результат
IRR(Payments)

0,1634

Предполагается, что платежи являются периодическими, например ежемесячными.

Если платежи не являются периодическими, используйте функцию XIRR.

Данные, используемые в примерах:

Cashflow:
LOAD 2013 as Year, * inline [
Date|Discount|Payments
2013-01-01|0.1|-10000
2013-03-01|0.1|3000
2013-10-30|0.1|4200
2014-02-01|0.2|6800
] (delimiter is '|');

NPV — функция скрипта

NPV() возвращает агрегированную чистую текущую стоимость вложения на основе константы discount_rate за период и ряда будущих платежей (отрицательные значения) и поступлений (положительные значения), представленных числами в элементе value, повторяемом в нескольких записях так, как это определено предложением group by. Предполагается, что платежи и поступления происходят в конце каждого периода.

Синтаксис:
NPV(discount_rate, value)

Тип возвращаемого значения: число. Результат имеет числовой денежный формат по умолчанию.

Аргументы:

Аргумент Описание
discount_rate discount_rate — это льготный тариф за какой-либо период. discount_rate является константой.
value Выражение или поле, содержащее данные для измерения.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения игнорируются.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Cashflow:
LOAD 2013 as Year, * inline [
Date|Discount|Payments
2013-01-01|0.1|-10000
2013-03-01|0.1|3000
2013-10-30|0.1|4200
2014-02-01|0.2|6800
] (delimiter is '|');

Cashflow1:
LOAD Year,NPV(0.2, Payments) as NPV1_2013 Resident Cashflow Group By Year;

Year

2013

NPV1_2013

-$540.12

При условии, что таблица Cashflow загружается, как в предыдущем примере:LOAD Year,NPV(Discount, Payments) as NPV2_2013 Resident Cashflow Group By Year, Discount;

Year

2013
2013

Discount

0,1
0,2

NPV2_2013
-$3456,05
$5666,67

NPV — функция диаграммы

Функция NPV() возвращает агрегированную чистую стоимость инвестиций на основе скидки discount_rate за период, серии будущих платежей (отрицательные значения) и дохода (положительные значения), представленных числами в элементе value, повторяемом в измерениях диаграммы. Предполагается, что платежи и поступления происходят в конце каждого периода.

Синтаксис:
NPV([TOTAL [<fld {,fld}>]] discount_rate, value)

Тип возвращаемого значения: число. Результат имеет числовой денежный формат по умолчанию.

Аргументы:

Аргумент Описание
discount_rate discount_rate — это льготный тариф за какой-либо период.
value Выражение или поле, содержащее данные для измерения.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках. Эти имена полей должны быть поднабором переменных измерений диаграммы. В этом случае при вычислении будут проигнорированы все переменные измерений диаграммы, кроме перечисленных, то есть одно значение возвращается для каждого сочетания значений полей в перечисленных полях измерений. Поля, которые в текущий момент не являются измерением в диаграмме, могут также включаться в список. Это может быть полезно для измерений группы, в которых поля измерений не фиксированы. Перечисление всех переменных в группе вызывает выполнение функции при изменении уровня детализации.

Ограничения:

Элементы discount_rate и value не должны содержать функции агрегирования, если только внутреннее агрегирование не содержит префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения игнорируются.

Примеры и результаты:

Пример Результат
NPV(Discount, Payments) -$540.12

Данные, используемые в примерах:

Cashflow:
LOAD 2013 as Year, * inline [
Date|Discount|Payments
2013-01-01|0.1|-10000
2013-03-01|0.1|3000
2013-10-30|0.1|4200
2014-02-01|0.2|6800
] (delimiter is '|');

XIRR — функция скрипта

Функция XIRR() возвращает агрегированную внутреннюю ставку доходов для графика потоков денежных средств (не обязательно регулярных), представленных парными числами в элементах pmt и date, повторяемых в нескольких записях так, как это определено предложением group by. Все платежи учитываются на основе года с 365 днями.

Синтаксис:
XIRR(pmt, date )

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
pmt

Платежи. Выражение или поле, содержащее потоки денежных средств, соответствующих графику платежей, представленному в элементе date.

date Выражение или поле, содержащее график дат, соответствующих потоку денежных средств, представленному в элементе pmt.

Ограничения:

Текстовые, отсутствующие значения и значения NULL в какой-либо или обеих частях пары данных приводят к игнорированию всей пары данных.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Cashflow:
LOAD 2013 as Year, * inline [
Date|Discount|Payments
2013-01-01|0.1|-10000
2013-03-01|0.1|3000
2013-10-30|0.1|4200
2014-02-01|0.2|6800
] (delimiter is '|');

Cashflow1:
LOAD Year,XIRR(Payments, Date) as XIRR2013 Resident Cashflow Group By Year;

Year

2013

XIRR2013

0.5385

XIRR — функция диаграммы

XIRR() возвращает агрегированную внутреннюю ставку доходов для графика потоков денежных средств (не обязательно периодических), представленных парными числами в выражениях, выданных элементами pmt и date, повторяемыми в измерениях диаграммы. Все платежи учитываются на основе года с 365 днями.

Синтаксис:
XIRR([TOTAL [<fld {,fld}>]] pmt, date)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
pmt

Платежи. Выражение или поле, содержащее потоки денежных средств, соответствующих графику платежей, представленному в элементе date.

date Выражение или поле, содержащее график дат, соответствующих потоку денежных средств, представленному в элементе pmt.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Элементы pmt и date не должны содержать функции агрегирования, если только внутреннее агрегирование не содержит префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

Примеры и результаты:

Пример Результат
XIRR(Payments, Date)

0,5385

Данные, используемые в примерах:

Cashflow:
LOAD 2013 as Year, * inline [
Date|Discount|Payments
2013-01-01|0.1|-10000
2013-03-01|0.1|3000
2013-10-30|0.1|4200
2014-02-01|0.2|6800
] (delimiter is '|');

XNPV — функция скрипта

Функция XNPV() возвращает агрегированную чистую текущую стоимость для графика потоков денежных средств (не обязательно регулярных), представленных парными числами в элементах pmt и date, повторяемых в нескольких записях так, как это определено предложением group by. Rate — это процентная ставка за период. Все платежи учитываются на основе года с 365 днями.

Синтаксис:
XNPV(discount_rate, pmt, date)

Тип возвращаемого значения: число. Результат имеет числовой денежный формат по умолчанию. .

Аргументы:

Аргумент Описание
discount_rate discount_rate — это льготный тариф за какой-либо период.
pmt Выражение или поле, содержащее данные для измерения.
date Выражение или поле, содержащее график дат, соответствующих потоку денежных средств, представленному в элементе pmt.

Ограничения:

Текстовые, отсутствующие значения и значения NULL в какой-либо или обеих частях пары данных приводят к игнорированию всей пары данных.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Cashflow:
LOAD 2013 as Year, * inline [
Date|Discount|Payments
2013-01-01|0.1|-10000
2013-03-01|0.1|3000
2013-10-30|0.1|4200
2014-02-01|0.2|6800
] (delimiter is '|');

Cashflow1:
LOAD Year,XNPV(0.2, Payments, Date) as XNPV1_2013 Resident Cashflow Group By Year;

Year

2013

XNPV1_2013

$2104.37

При условии, что таблица Cashflow загружается, как в предыдущем примере:LOAD Year,XNPV(Discount, Payments, Date) as XNPV2_2013 Resident Cashflow Group By Year, Discount;

Year

2013
2013

Discount

0,1
0,2

XNPV2_2013

-$3164,35
$6800,00

XNPV — функция диаграммы

XNPV() возвращает агрегированную чистую стоимость для графика потоков денежных средств (не обязательно периодических), представленных парными числами в выражениях, выданных элементами pmt и date, повторяемыми в измерениях диаграммы. Все платежи учитываются на основе года с 365 днями.

Синтаксис:
XNPV([TOTAL [<fld{,fld}>]] discount_rate, pmt, date)

Тип возвращаемого значения: число Результат имеет числовой денежный формат по умолчанию.

Аргументы:

Аргумент Описание
discount_rate discount_rate — это льготный тариф за какой-либо период.
pmt Платежи. Выражение или поле, содержащее потоки денежных средств, соответствующих графику платежей, представленному в элементе date.
date Выражение или поле, содержащее график дат, соответствующих потоку денежных средств, представленному в элементе pmt.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Элементы discount_rate,pmt и date не должны содержать функции агрегирования, если только внутренние агрегирования не содержат префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

Примеры и результаты:

Пример Результат
XNPV(Discount, Payments, Date) -$3164.35

Данные, используемые в примерах:

Cashflow:
LOAD 2013 as Year, * inline [
Date|Discount|Payments
2013-01-01|0.1|-10000
2013-03-01|0.1|3000
2013-10-30|0.1|4200
2014-02-01|0.2|6800
] (delimiter is '|');

Функции статистического агрегирования

Пользуйтесь информацией из раскрывающегося списка по каждой функции, чтобы увидеть краткое описание и синтаксис каждой функции. Дополнительную информацию можно получить, если щелкнуть имя функции в описании синтаксиса.

Функции статистического агрегирования в скрипте загрузки

В скриптах можно использовать следующие статистические функции агрегирования.

Avg

Функция Avg() находит среднее значение агрегированных данных в выражении в нескольких записях, как это определено предложением group by.

avg ([distinct] expression)

Correl

Функция Correl() возвращает агрегированный коэффициент корреляции для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

correl(x-expression, y-expression)

Fractile

Функция Fractile() находит значение, соответствующее квантилю агрегированных данных в выражении в нескольких записях, как это определено предложением group by.

fractile(expression, fractile)

Kurtosis

Функция Kurtosis() возвращает эксцесс данных в выражении в нескольких записях, как это определено предложением group by.

kurtosis ([distinct ] expression )

LINEST_B

Функция LINEST_B() возвращает агрегированное значение b (отрезок на оси y) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

linest_b(y-expression, x-expression [, y0 [, x0 ]])

LINEST_df

Функция LINEST_DF() возвращает агрегированное значение степеней свободы линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

linest_df (y-expression, x-expression [, y0 [, x0 ]])

LINEST_f

Эта функция скрипта возвращает агрегированную статистику F (r2/(1-r2)) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено выражением group by.

linest_f(y-expression, x-expression [, y0 [, x0 ]])

LINEST_m

Функция LINEST_M() возвращает агрегированное значение m (пересечение) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

linest_m (y-expression, x-expression [, y0 [, x0 ]])

LINEST_r2

LINEST_R2() возвращает агрегированное значение r2 (коэффициент детерминации) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

linest_r2(y-expression, x-expression [, y0 [, x0 ]])

LINEST_seb

Функция LINEST_SEB() возвращает агрегированную стандартную ошибку значения b линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

linest_seb (y-expression, x-expression [, y0 [, x0 ]])

LINEST_sem

Функция LINEST_SEM() возвращает агрегированную стандартную ошибку значения m линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

linest_sem (y-expression, x-expression [, y0 [, x0 ]])

LINEST_sey

Функция LINEST_SEY() возвращает агрегированную стандартную ошибку оценки y линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

linest_sey (y-expression, x-expression [, y0 [, x0 ]])

LINEST_ssreg

Функция LINEST_SSREG() возвращает агрегированную остаточную сумму квадратов линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

linest_ssreg (y-expression, x-expression [, y0 [, x0 ]])

Linest_ssresid

Функция LINEST_SSRESID() возвращает агрегированную остаточную сумму квадратов линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

linest_ssresid (y-expression, x-expression [, y0 [, x0 ]])

Median

Функция Median() возвращает агрегированное значение median значений в выражении в нескольких записях, как это определено предложением group by.

median(expression)

Skew

Функция Skew() возвращает асимметрию выражения в нескольких записях, как это определено предложением group by.

skew([ distinct] expression)

Stdev

Функция Stdev() возвращает стандартное отклонение значений в выражении в нескольких записях, как это определено предложением group by.

stdev([distinct] expression)

Sterr

Функция Sterr() возвращает агрегированную стандартную ошибку (stdev/sqrt(n)) для серии значений, представленных выражением, повторяемым в нескольких записях так, как это определено предложением group by.

sterr ([distinct] expression)

STEYX

Функция STEYX() возвращает агрегированную стандартную ошибку предсказанного значения y для каждого значения x в регрессии для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

steyx (y-expression, x-expression)

Функции статистического агрегирования в выражениях диаграмм

Следующие функции статистического агрегирования можно использовать в диаграммах.

Avg

Функция Avg() возвращает агрегированное среднее значения выражения или поля, повторяемых в измерениях диаграммы.

avg([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] expr)

Correl

Функция Correl() возвращает агрегированный коэффициент корреляции для двух наборов данных. Функция корреляции — это мера отношений между наборами данных. Она агрегирована для пар значений (x,y), повторяемых в измерениях диаграммы.

correl([{SetExpression}] [TOTAL [<fld {, fld}>]] value1, value2 )

Fractile

Функция Fractile() находит значение, соответствующее квантилю агрегированных данных в диапазоне, выданном выражением, повторяемым в измерениях диаграммы.

fractile([{SetExpression}] [TOTAL [<fld {, fld}>]] expr, fraction)

Kurtosis

Функция Kurtosis() находит эксцесс диапазона данных, агрегированных в выражении или поле, повторяемых в измерениях диаграммы.

kurtosis([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] expr)

LINEST_b

Функция LINEST_B() возвращает агрегированное значение b (отрезок на оси y) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

linest_b([{SetExpression}] [TOTAL [<fld{ ,fld}>]] y_value, x_value[, y0_const[, x0_const]])

LINEST_df

Функция LINEST_DF() возвращает агрегированные степени свободы линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

linest_df([{SetExpression}] [TOTAL [<fld{, fld}>]] y_value, x_value [, y0_const [, x0_const]])

LINEST_f

Функция LINEST_F() возвращает агрегированное статическое F (r2/(1-r2)) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

linest_f([{SetExpression}] [TOTAL[<fld{, fld}>]] y_value, x_value [, y0_const [, x0_const]])

LINEST_m

Функция LINEST_M() возвращает агрегированное значение m (пересечение) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

linest_m([{SetExpression}] [TOTAL[<fld{, fld}>]] y_value, x_value [, y0_const [, x0_const]])

LINEST_r2

Функция LINEST_R2() возвращает агрегированное значение r2 (коэффициент детерминации) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

linest_r2([{SetExpression}] [TOTAL [<fld{ ,fld}>]] y_value, x_value[, y0_const[, x0_const]])

LINEST_seb

Функция LINEST_SEB() возвращает агрегированную стандартную ошибку значения b линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

linest_seb([{SetExpression}] [TOTAL [<fld{ ,fld}>]] y_value, x_value[, y0_const[, x0_const]])

LINEST_sem

Функция LINEST_SEM() возвращает агрегированную стандартную ошибку значения m линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

linest_sem([{set_expression}][ distinct ] [TOTAL [<fld {,fld}>] ] y-expression, x-expression [, y0 [, x0 ]] )

LINEST_sey

Функция LINEST_SEY() возвращает агрегированную стандартную ошибку значения y линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

linest_sey([{SetExpression}] [TOTAL [<fld{ ,fld}>]] y_value, x_value[, y0_const[, x0_const]])

LINEST_ssreg

Функция LINEST_SSREG() возвращает агрегированную сумму регрессии квадратов линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

linest_ssreg([{SetExpression}] [TOTAL [<fld{ ,fld}>]] y_value, x_value[, y0_const[, x0_const]])

LINEST_ssresid

Функция LINEST_SSRESID() возвращает агрегированную остаточную сумму квадратов линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

linest_ssresid([{SetExpression}] [TOTAL [<fld{ ,fld}>]] y_value, x_value[, y0_const[, x0_const]])

Median

Функция Median() возвращает значение median диапазона значений, агрегированных в выражении, повторяемом в измерениях диаграммы.

median([{SetExpression}] [TOTAL [<fld{, fld}>]] expr)

Skew

Функция Skew() возвращает агрегированную асимметрию значений выражения или поля, повторяемых в измерениях диаграммы.

skew([{SetExpression}] [DISTINCT] [TOTAL [<fld{ ,fld}>]] expr)

Stdev

Функция Stdev() находит стандартное отклонение диапазона данных, агрегированных в выражении или поле, повторяемых в измерениях диаграммы.

stdev([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] expr)

Sterr

Функция Sterr() находит значение стандартной ошибки среднего значения (stdev/sqrt(n)) для серии значений, агрегированных в выражении, повторяемом в измерениях диаграммы.

sterr([{SetExpression}] [DISTINCT] [TOTAL[<fld{, fld}>]] expr)

STEYX

Функция STEYX() возвращает агрегированную стандартную ошибку во время предсказания значения y для каждого значения x в линейной регрессии, определенной серией координат, представленных парными числами в выражениях y_value и x_value.

steyx([{SetExpression}] [TOTAL [<fld{, fld}>]] y_value, x_value)

Avg — функция скрипта

Функция Avg() находит среднее значение агрегированных данных в выражении в нескольких записях, как это определено предложением group by.

Синтаксис:
Avg([DISTINCT] expr)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
DISTINCT Если слово DISTINCT указано перед выражением, все дубликаты будут проигнорированы.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Temp:
crosstable (Month, Sales) load * inline [
Customer|Jan|Feb|Mar||Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec
Astrida|46|60|70|13|78|20|45|65|78|12|78|22
Betacab|65|56|22|79|12|56|45|24|32|78|55|15
Canutility|77|68|34|91|24|68|57|36|44|90|67|27
Divadip|36|44|90|67|27|57|68|47|90|80|94
] (delimiter is '|');

Avg1:
LOAD Customer, Avg(Sales) as MyAverageSalesByCustomer Resident Temp Group By Customer;
Customer MyAverageSalesByCustomer
Astrida 48.916667
Betacab 44.916667
Canutility 56.916667
Divadip 63.083333
Это можно проверить на листе путем создания таблицы, включая меру:
Sum(Sales)/12

При условии, что таблица Temp загружается, как в предыдущем примере:

LOAD Customer,Avg(DISTINCT Sales) as MyAvgSalesDistinct Resident Temp Group By Customer;
Customer MyAverageSalesByCustomer
Astrida 43.1
Betacab 43.909091
Canutility 55.909091
Divadip 61

Учитываются только отдельные значения.

Avg — функция диаграммы

Функция Avg() возвращает агрегированное среднее значения выражения или поля, повторяемых в измерениях диаграммы.

Синтаксис:
Avg([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] expr)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Примеры и результаты:

Customer Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
Astrida 46 60 70 13 78 20 45 65 78 12 78 22
Betacab 65 56 22 79 12 56 45 24 32 78 55 15
Canutility 77 68 34 91 24 68 57 36 44 90 67 27
Divadip 57 36 44 90 67 27 57 68 47 90 80 94

Customer Sum(Sales) Avg(Sales) Avg(TOTAL Sales) Avg(DISTINCT Sales) Avg({1}DISTINCT Sales)
2566 53.46 53.458333 51.862069 53.458333
Astrida 587 48.92 53.458333 43.1 53.458333
Betacab 539 44.92 53.458333 43.909091 53.458333
Canutility 683 56.92 53.458333 55.909091 53.458333
Divadip 757 63.08 53.458333 61 53.458333

Пример Результат
Avg(Sales)

Для таблицы, включающей измерение Customer и меру Avg([Sales]), если показано значение Итоги, результат будет 2566.

Avg([TOTAL (Sales)) 53,458333 для всех значений элемента Customer, поскольку префикс TOTAL означает, что измерения игнорируются.
Avg(DISTINCT (Sales)) 51,862069 для итогового значения, поскольку использование префикса Distinct означает, что оцениваются только уникальные значения в поле Sales для каждого элемента Customer.

Данные, используемые в примерах:

Monthnames:
LOAD * INLINE [
Month, Monthnumber
Jan, 1
Feb, 2
Mar, 3
Apr, 4
May, 5
Jun, 6
Jul, 7
Aug, 8
Sep, 9
Oct, 10
Nov, 11
Dec, 12
];
Sales2013:
crosstable (Month, Sales) LOAD * inline [
Customer|Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec
Astrida|46|60|70|13|78|20|45|65|78|12|78|22
Betacab|65|56|22|79|12|56|45|24|32|78|55|15
Canutility|77|68|34|91|24|68|57|36|44|90|67|27
Divadip|57|36|44|90|67|27|57|68|47|90|80|94
] (delimiter is '|');

Чтобы выполнить сортировку месяцев в правильном порядке, при создании диаграмм перейдите на вкладку Sort в свойствах диаграммы и установите флажок Expression для параметра Sort by. В поле выражения напишите Monthnumber.

Correl — функция скрипта

Функция Correl() возвращает агрегированный коэффициент корреляции для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

Синтаксис:
Correl(value1, value2)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value1, value2 Выражения или поля, содержащие два образца множеств, для которых необходимо измерить коэффициент корреляции.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Salary:
Load *, 1 as Grp;
LOAD * inline [
"Employee name"|Gender|Age|Salary
Aiden Charles|Male|20|25000
Brenda Davies|Male|25|32000
Charlotte Edberg|Female|45|56000
Daroush Ferrara|Male|31|29000
Eunice Goldblum|Female|31|32000
Freddy Halvorsen|Male|25|26000
Gauri Indu|Female|36|46000
Harry Jones|Male|38|40000
Ian Underwood|Male|40|45000
Jackie Kingsley|Female|23|28000
] (delimiter is '|');
Correl1:
LOAD Grp,
Correl(Age,Salary) as Correl_Salary Resident Salary Group By Grp;
Correl_Salary = 0,9270611

Correl — функция диаграммы

Функция Correl() возвращает агрегированный коэффициент корреляции для двух наборов данных. Функция корреляции — это мера отношений между наборами данных. Она агрегирована для пар значений (x,y), повторяемых в измерениях диаграммы.

Синтаксис:
Correl([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] value1, value2 )

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value1, value2 Выражения или поля, содержащие два образца множеств, для которых необходимо измерить коэффициент корреляции.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

Примеры и результаты:

Пример Результат
Correl(Age, Salary)

Для таблицы, включающей измерение Employee name и меру Correl(Age, Salary), результат будет 0,9270611. Результат отображается только для итоговой ячейки.

Correl(TOTAL Age, Salary))

0,927. Этот и следующие результаты показаны в формате с тремя знаками после десятичной запятой для удобства считывания.

Данные, используемые в примерах:

Salary:
LOAD * inline [
"Employee name"|Gender|Age|Salary
Aiden Charles|Male|20|25000
Brenda Davies|Male|25|32000
Charlotte Edberg|Female|45|56000
Daroush Ferrara|Male|31|29000
Eunice Goldblum|Female|31|32000
Freddy Halvorsen|Male|25|26000
Gauri Indu|Female|36|46000
Harry Jones|Male|38|40000
Ian Underwood|Male|40|45000
Jackie Kingsley|Female|23|28000
] (delimiter is '|');

Fractile — функция скрипта

Функция Fractile() находит значение, соответствующее квантилю агрегированных данных в выражении в нескольких записях, как это определено предложением group by.

Синтаксис:
Fractile(expr, fraction)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
fraction Число от 0 до 1, соответствующее квантилю, которое подлежит вычислению.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Table1:
crosstable LOAD recno() as ID, * inline [
Observation|Comparison
35|2
40|27
12|38
15|31
21|1
14|19
46|1
10|34
28|3
48|1
16|2
30|3
32|2
48|1
31|2
22|1
12|3
39|29
19|37
25|2 ] (delimiter is '|');
Fractile1:
LOAD Type,
Fractile(Value,0.75) as MyFractile Resident Table1 Group By Type;

В таблице с измерениями Type и MyFractile результаты вычислений Fractile() в скрипте загрузки будут показаны как:

Type MyFractile
Comparison 27.5
Observation 36

Fractile — функция диаграммы

Функция Fractile() находит значение, соответствующее квантилю агрегированных данных в диапазоне, выданном выражением, повторяемым в измерениях диаграммы.

Синтаксис:
Fractile([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] expr, fraction)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
fraction Число от 0 до 1, соответствующее квантилю, которое подлежит вычислению.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Примеры и результаты:

Customer Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
Astrida 46 60 70 13 78 20 45 65 78 12 78 22
Betacab 65 56 22 79 12 56 45 24 32 78 55 15
Canutility 77 68 34 91 24 68 57 36 44 90 67 27
Divadip 57 36 44 90 67 27 57 68 47 90 80 94

Пример Результат
Fractile(Sales, 0.75)

Диаграмма с измерением = Customer и выражением = Fractile(Sales,0.75) дает результат, равный 71,75. Это точка в распределении значений элемента Sales, ниже которой находится 75% значений.

Fractile(TOTAL Sales, 0.75)) 71,75 для всех значений элемента Customer, поскольку префикс TOTAL означает, что измерения игнорируются.
Fractile(DISTINCT Sales, 0.75) 70 для итогового значения, поскольку использование префикса DISTINCT означает, что оцениваются только уникальные значения в поле Sales для каждого элемента Customer.

Данные, используемые в примерах:

Monthnames:
LOAD * INLINE [
Month, Monthnumber
Jan, 1
Feb, 2
Mar, 3
Apr, 4
May, 5
Jun, 6
Jul, 7
Aug, 8
Sep, 9
Oct, 10
Nov, 11
Dec, 12
];
Sales2013:
crosstable (Month, Sales) LOAD * inline [
Customer|Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec
Astrida|46|60|70|13|78|20|45|65|78|12|78|22
Betacab|65|56|22|79|12|56|45|24|32|78|55|15
Canutility|77|68|34|91|24|68|57|36|44|90|67|27
Divadip|57|36|44|90|67|27|57|68|47|90|80|94
] (delimiter is '|');

Чтобы выполнить сортировку месяцев в правильном порядке, при создании диаграмм перейдите на вкладку Sort в свойствах диаграммы и установите флажок Expression для параметра Sort by. В поле выражения напишите Monthnumber.

Kurtosis — функция скрипта

Функция Kurtosis() возвращает эксцесс данных в выражении в нескольких записях, как это определено предложением group by.

Синтаксис:
Kurtosis([DISTINCT ] expr )

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
distinct Если слово DISTINCT указано перед выражением, все дубликаты будут проигнорированы.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Table1:
crosstable LOAD recno() as ID, * inline [
Observation|Comparison
35|2
40|27
12|38
15|31
21|1
14|19
46|1
10|34
28|3
48|1
16|2
30|3
32|2
48|1
31|2
22|1
12|3
39|29
19|37
25|2 ] (delimiter is '|');
Kurtosis1:
LOAD Type,
Kurtosis(Value) as MyKurtosis1,
Kurtosis(DISTINCT Value) as MyKurtosis2
Resident Table1 Group By Type;

В таблице с измерениями Type, MyKurtosis1 и MyKurtosis2 результаты вычислений Kurtosis() в скрипте загрузки будут показаны как:

Type MyKurtosis1 MyKurtosis2
Comparison -1.1612957 -1.4982366
Observation -1.1148768 -0.93540144

Kurtosis — функция диаграммы

Функция Kurtosis() находит эксцесс диапазона данных, агрегированных в выражении или поле, повторяемых в измерениях диаграммы.

Синтаксис:
Kurtosis([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] expr)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Примеры и результаты:

Type Value
Comparison 2 27 38 31 1 19 1 34 3 1 2 3 2 1 2 1 3 29 37 2
Observation 35 40 12 15 21 14 46 10 28 48 16 30 32 48 31 22 12 39 19 25

Пример Результат
Kurtosis(Value)

Если для таблицы, включающей измерение Type и меру Kurtosis(Value), показано значение Итоги, форматирование числа задастся на 3 значащие цифры, и результатом будет 1,252. Для элемента Comparison это будет 1,161, а для элемента Observation — 1,115.

Kurtosis(TOTAL Value)) 1,252 для всех значений элемента Type, поскольку префикс TOTAL означает, что измерения игнорируются.

Данные, используемые в примерах:

Table1:
crosstable LOAD recno() as ID, * inline [
Observation|Comparison
35|2
40|27
12|38
15|31
21|1
14|19
46|1
10|34
28|3
48|1
16|2
30|3
32|2
48|1
31|2
22|1
12|3
39|29
19|37
25|2 ] (delimiter is '|');

LINEST_B — функция скрипта

Функция LINEST_B() возвращает агрегированное значение b (отрезок на оси y) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

Синтаксис:
LINEST_B (y-value, x-value[, y0 [, x0 ]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y(0), x(0)

Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_B — функция диаграммы

Функция LINEST_B() возвращает агрегированное значение b (отрезок на оси y) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

Синтаксис:
LINEST_B([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] y_value, x_value [, y0_const [ , x0_const]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y0_const, x0_const Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_DF — функция скрипта

Функция LINEST_DF() возвращает агрегированное значение степеней свободы линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

Синтаксис:
LINEST_DF (y-value, x-value[, y0 [, x0 ]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y(0), x(0)

Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_DF — функция диаграммы

Функция LINEST_DF() возвращает агрегированные степени свободы линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

Синтаксис:
LINEST_DF([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] y_value, x_value [, y0_const [, x0_const]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y0, x0 Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_F — функция скрипта

Эта функция скрипта возвращает агрегированную статистику F (r2/(1-r2)) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено выражением group by.

Синтаксис:
LINEST_F (y-value, x-value[, y0 [, x0 ]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y(0), x(0)

Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_F — функция диаграммы

Функция LINEST_F() возвращает агрегированное статическое F (r2/(1-r2)) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

Синтаксис:
LINEST_F([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] y_value, x_value [, y0_const [, x0_const]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y0, x0 Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_M — функция скрипта

Функция LINEST_M() возвращает агрегированное значение m (пересечение) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

Синтаксис:
LINEST_M (y-value, x-value[, y0 [, x0 ]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y(0), x(0)

Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_M — функция диаграммы

Функция LINEST_M() возвращает агрегированное значение m (пересечение) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

Синтаксис:
LINEST_M([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] y_value, x_value [, y0_const [, x0_const]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y0, x0 Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_R2 — функция скрипта

LINEST_R2() возвращает агрегированное значение r2 (коэффициент детерминации) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

Синтаксис:
LINEST_R2 (y-value, x-value[, y0 [, x0 ]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y(0), x(0)

Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_R2 — функция диаграммы

Функция LINEST_R2() возвращает агрегированное значение r2 (коэффициент детерминации) линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

Синтаксис:
LINEST_R2([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] y_value, x_value[, y0_const[, x0_const]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y0, x0 Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_SEB — функция скрипта

Функция LINEST_SEB() возвращает агрегированную стандартную ошибку значения b линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

Синтаксис:
LINEST_SEB (y-value, x-value[, y0 [, x0 ]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y(0), x(0)

Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_SEB — функция диаграммы

Функция LINEST_SEB() возвращает агрегированную стандартную ошибку значения b линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

Синтаксис:
LINEST_SEB([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] y_value, x_value[, y0_const[, x0_const]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y0, x0 Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL >. и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_SEM — функция скрипта

Функция LINEST_SEM() возвращает агрегированную стандартную ошибку значения m >. линейной регрессии, определенной уравнением y=mx+b >. для серии координат, представленных парными числами в выражениях x-expression>. и y-expression>., повторяемых в нескольких записях так, как это определено предложением group by.

Синтаксис:
LINEST_SEM (y-value, x-value[, y0 [, x0 ]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value >. Выражение или поле, содержащее диапазон значений y >. для измерения.
x_value >. Выражение или поле, содержащее диапазон значений x >. для измерения.
y(0), x(0)

Дополнительное значение y0>. можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0>. и x0>., можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0>. и x0>. не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0>. и x0>. указаны, используется одна пара данных.

Ограничения:

Текстовые значения, значения NULL >. и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_SEM — функция диаграммы

Функция LINEST_SEM() возвращает агрегированную стандартную ошибку значения m линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

Синтаксис:
LINEST_SEM([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] y_value, x_value[, y0_const[, x0_const]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y0, x0 Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_SEY — функция скрипта

Функция LINEST_SEY() возвращает агрегированную стандартную ошибку оценки y линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

Синтаксис:
LINEST_SEY (y-value, x-value[, y0 [, x0 ]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y(0), x(0)

Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_SEY — функция диаграммы

Функция LINEST_SEY() возвращает агрегированную стандартную ошибку значения y линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

Синтаксис:
LINEST_SEY([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] y_value, x_value[, y0_const[, x0_const]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y0, x0 Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_SSREG — функция скрипта

Функция LINEST_SSREG() возвращает агрегированную остаточную сумму квадратов линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

Синтаксис:
LINEST_SSREG (y-value, x-value[, y0 [, x0 ]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y(0), x(0)

Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_SSREG — функция диаграммы

Функция LINEST_SSREG() возвращает агрегированную сумму регрессии квадратов линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

Синтаксис:
LINEST_SSREG([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] y_value, x_value[, y0_const[, x0_const]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y0, x0 Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_SSRESID — функция скрипта

Функция LINEST_SSREG() возвращает агрегированную остаточную сумму квадратов линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

Синтаксис:
LINEST_SSRESID (y-value, x-value[, y0 [, x0 ]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y(0), x(0)

Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

LINEST_SSRESID — функция диаграммы

Функция LINEST_SSREG() возвращает агрегированную остаточную сумму квадратов линейной регрессии, определенной уравнением y=mx+b для серии координат, представленных парными числами в выражениях x_value и y_value, повторяемых в измерениях диаграммы.

Синтаксис:
LINEST_SSRESID([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] y_value, x_value[, y0_const[, x0_const]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.
y0, x0 Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Если значения y0 и x0 не указаны, для вычисления функции требуются хотя бы две допустимые пары данных. Если y0 и x0 указаны, используется одна пара данных.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Дополнительное значение y0 можно указать путем принудительного прохождения линии регрессии через ось y в определенной точке. Указав y0 и x0, можно задать принудительное прохождение линии регрессии через одиночную фиксированную координату.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

Median — функция скрипта

Функция Median() возвращает агрегированное значение median значений в выражении в нескольких записях, как это определено предложением group by.

Синтаксис:
Median (expr)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.

Примеры и результаты:

Добавьте образец скрипта в приложение и запустите. Затем создайте прямую таблицу с полями Type и MyMedian в качестве измерений.

Пример Результат
Table1:
crosstable LOAD recno() as ID, * inline [
Observation|Comparison
35|2
40|27
12|38
15|31
21|1
14|19
46|1
10|34
28|3
48|1
16|2
30|3
32|2
48|1
31|2
22|1
12|3
39|29
19|37
25|2 ] (delimiter is '|');
Median1:
LOAD Type,
Median(Value) as MyMedian
Resident Table1 Group By Type;

Результаты вычисления Median() будут показаны как:

  • Type  — MyMedian
  • Comparison  — 2.5
  • Observation  — 26.5

Median — функция диаграммы

Функция Median() возвращает значение median диапазона значений, агрегированных в выражении, повторяемом в измерениях диаграммы.

Синтаксис:
Median([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] expr)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Примеры и результаты:

Добавьте образец скрипта в приложение и запустите. Затем создайте прямую таблицу с Type в качестве измерения и Median(Value) в качестве меры.

Необходимо установить флажок Totals в свойствах таблицы.

Пример Результат
Table1:
crosstable LOAD recno() as ID, * inline [
Observation|Comparison
35|2
40|27
12|38
15|31
21|1
14|19
46|1
10|34
28|3
48|1
16|2
30|3
32|2
48|1
31|2
22|1
12|3
39|29
19|37
25|2 ] (delimiter is '|');

Значения median для:

  • Totals равно 19
  • Comparison равно 2,5
  • Observation равно 26,5

Skew — функция скрипта

Функция Skew() возвращает асимметрию выражения в нескольких записях, как это определено предложением group by.

Синтаксис:
Skew([ DISTINCT] expr)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
DISTINCT Если слово DISTINCT указано перед выражением, все дубликаты будут проигнорированы.

Примеры и результаты:

Добавьте образец скрипта в приложение и запустите. Затем создайте прямую таблицу с полями Type и MySkew в качестве измерений.

Пример Результат
Table1:
crosstable LOAD recno() as ID, * inline [
Observation|Comparison
35|2
40|27
12|38
15|31
21|1
14|19
46|1
10|34
28|3
48|1
16|2
30|3
32|2
48|1
31|2
22|1
12|3
39|29
19|37
25|2 ] (delimiter is '|');
Skew1:
LOAD Type,
Skew(Value) as MySkew
Resident Table1 Group By Type;

Результаты вычисления Skew() в скрипте загрузки данных следующие:

  • Type  — MySkew
  • Comparison  — 0.86414768
  • Observation  — 0.32625351

Skew — функция диаграммы

Функция Skew() возвращает агрегированную асимметрию значений выражения или поля, повторяемых в измерениях диаграммы.

Синтаксис:
Skew([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] expr)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Примеры и результаты:

Добавьте образец скрипта в приложение и запустите. Затем создайте прямую таблицу с Type в качестве измерения и Skew(Value) в качестве меры.

Необходимо установить флажок Totals в свойствах таблицы.

Пример Результат
Table1:
crosstable LOAD recno() as ID, * inline [
Observation|Comparison
35|2
40|27
12|38
15|31
21|1
14|19
46|1
10|34
28|3
48|1
16|2
30|3
32|2
48|1
31|2
22|1
12|3
39|29
19|37
25|2 ] (delimiter is '|');

Результаты вычисления Skew(Value) будут показаны как:

  • Total — 0.23522195
  • Comparison  — 0.86414768
  • Observation  — 0.32625351

Stdev — функция скрипта

Функция Stdev() возвращает стандартное отклонение значений в выражении в нескольких записях, как это определено предложением group by.

Синтаксис:
Stdev([DISTINCT] expr)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
distinct Если слово DISTINCT указано перед выражением, все дубликаты будут проигнорированы.

Примеры и результаты:

Добавьте образец скрипта в приложение и запустите. Затем создайте прямую таблицу с полями Type и MyStdev в качестве измерений.

Пример Результат
Table1:
crosstable LOAD recno() as ID, * inline [
Observation|Comparison
35|2
40|27
12|38
15|31
21|1
14|19
46|1
10|34
28|3
48|1
16|2
30|3
32|2
48|1
31|2
22|1
12|3
39|29
19|37
25|2 ] (delimiter is '|');
Stdev1:
LOAD Type,
Stdev(Value) as MyStdev
Resident Table1 Group By Type;

Результаты вычисления Stdev() будут показаны как:

  • Type  — MyStdev
  • Comparison  — 14.61245
  • Observation  — 12.507997

Stdev — функция диаграммы

Функция Stdev() находит стандартное отклонение диапазона данных, агрегированных в выражении или поле, повторяемых в измерениях диаграммы.

Синтаксис:
Stdev([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] expr)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Примеры и результаты:

Добавьте образец скрипта в приложение и запустите. Затем создайте прямую таблицу с Type в качестве измерения и Stdev(Value) в качестве меры.

Необходимо установить флажок Totals в свойствах таблицы.

Пример Результат
Table1:
crosstable LOAD recno() as ID, * inline [
Observation|Comparison
35|2
40|27
12|38
15|31
21|1
14|19
46|1
10|34
28|3
48|1
16|2
30|3
32|2
48|1
31|2
22|1
12|3
39|29
19|37
25|2 ] (delimiter is '|');

Результаты вычисления Stdev(Value) будут показаны как:

  • Total — 15.47529
  • Comparison  — 14.61245
  • Observation  — 12.507997

Sterr — функция скрипта

Функция Sterr() возвращает агрегированную стандартную ошибку (stdev/sqrt(n)) для серии значений, представленных выражением, повторяемым в нескольких записях так, как это определено предложением group by.

Синтаксис:
Sterr ([DISTINCT] expr)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
distinct Если слово DISTINCT указано перед выражением, все дубликаты будут проигнорированы.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения игнорируются.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Table1:
crosstable LOAD recno() as ID, * inline [
Observation|Comparison
35|2
40|27
12|38
15|31
21|1
14|19
46|1
10|34
28|3
48|1
16|2
30|3
32|2
48|1
31|2
22|1
12|3
39|29
19|37
25|2 ] (delimiter is '|');
Sterr1:
LOAD Type,
Sterr(Value) as MySterr
Resident Table1 Group By Type;

В таблице с измерениями Type и MySterr результаты вычисления Sterr() в скрипте загрузки будут показаны как:

Type MySterr
Comparison 3.2674431
Observation 2.7968733

Sterr — функция диаграммы

Функция Sterr() находит значение стандартной ошибки среднего значения (stdev/sqrt(n)) для серии значений, агрегированных в выражении, повторяемом в измерениях диаграммы.

Синтаксис:
Sterr([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] expr)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения игнорируются.

Примеры и результаты:

Добавьте образец скрипта в приложение и запустите. Затем создайте прямую таблицу с Type в качестве измерения и Sterr(Value) в качестве меры.

Необходимо установить флажок Totals в свойствах таблицы.

Пример Результат

Sterr(Value)

Table1:
crosstable LOAD recno() as ID, * inline [
Observation|Comparison
35|2
40|27
12|38
15|31
21|1
14|19
46|1
10|34
28|3
48|1
16|2
30|3
32|2
48|1
31|2
22|1
12|3
39|29
19|37
25|2 ] (delimiter is '|');

Результаты вычисления Sterr(Value) будут показаны как:

  • Total — 2.4468583
  • Comparison  — 3.2674431
  • Observation  — 2.7968733

STEYX — функция скрипта

Функция STEYX() возвращает агрегированную стандартную ошибку предсказанного значения y для каждого значения x в регрессии для серии координат, представленных парными числами в выражениях x-expression и y-expression, повторяемых в нескольких записях так, как это определено предложением group by.

Синтаксис:
STEYX (y-value, x-value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон значений y для измерения.
x_value Выражение или поле, содержащее диапазон значений x для измерения.

Ограничения:

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
Trend:
Load *, 1 as Grp;
LOAD * inline [
Month|KnownY|KnownX
Jan|2|6
Feb|3|5
Mar|9|11
Apr|6|7
May|8|5
Jun|7|4
Jul|5|5
Aug|10|8
Sep|9|10
Oct|12|14
Nov|15|17
Dec|14|16
] (delimiter is '|');
STEYX1:
LOAD Grp,
STEYX(KnownY, KnownX) as MySTEYX
Resident Trend Group By Grp;

В таблице с измерением MySTEYX результат вычисления STEYX() в скрипте загрузки будет показан как 2,0714764.

STEYX — функция диаграммы

Функция STEYX() возвращает агрегированную стандартную ошибку во время предсказания значения y для каждого значения x в линейной регрессии, определенной серией координат, представленных парными числами в выражениях y_value и x_value.

Синтаксис:
STEYX([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] y_value, x_value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
y_value Выражение или поле, содержащее диапазон известных y-значений для измерения.
x_value Выражение или поле, содержащее диапазон известных x-значений для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

Ограничения:

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

Примеры и результаты:

Добавьте образец скрипта в приложение и запустите. Затем создайте прямую таблицу с KnownY и KnownX в качестве измерения и Steyx(KnownY,KnownX) в качестве меры.

Необходимо установить флажок Totals в свойствах таблицы.

Пример Результат
Trend:
LOAD * inline [
Month|KnownY|KnownX
Jan|2|6
Feb|3|5
Mar|9|11
Apr|6|7
May|8|5
Jun|7|4
Jul|5|5
Aug|10|8
Sep|9|10
Oct|12|14
Nov|15|17
Dec|14|16
] (delimiter is '|');

Результат вычисления STEYX(KnownY,KnownX) равен 2,071 (если форматирование числа задано на 3 десятичных знака).

Примеры использования функций linest

Функции linest используются для обнаружения значений, связанных с анализом линейной регрессии. В этом разделе описано, как построить диаграммы с помощью данных образца, чтобы найти значения функций linest, доступных в программе QlikView (и Qlik Sense) Функции linest можно использовать как в скрипте загрузки, так и в выражениях диаграммы.

Описание синтаксиса и аргументов см. в индивидуальных темах функций диаграммы и скрипта linest.

Загрузка данных образца

Выполните следующие действия.

  1. Создайте новый документ.
  2. Выберите Редактор скрипта на панели инструментов и введите следующие элементы в скрипт:

    T1:
    LOAD *, 1 as Grp;
    LOAD * inline [
    X |Y
    1| 0
    2|1
    3|3
    4| 8
    5| 14
    6| 20
    7| 0
    8| 50
    9| 25
    10| 60
    11| 38
    12| 19
    13| 26
    14| 143
    15| 98
    16| 27
    17| 59
    18| 78
    19| 158
    20| 279 ] (delimiter is '|');
    R1:
    LOAD
    Grp,
    linest_B(Y,X) as Linest_B,
    linest_DF(Y,X) as Linest_DF,
    linest_F(Y,X) as Linest_F,
    linest_M(Y,X) as Linest_M,
    linest_R2(Y,X) as Linest_R2,
    linest_SEB(Y,X,1,1) as Linest_SEB,
    linest_SEM(Y,X) as Linest_SEM,
    linest_SEY(Y,X) as Linest_SEY,
    linest_SSREG(Y,X) as Linest_SSREG,
    linest_SSRESID(Y,X) as Linest_SSRESID
    resident T1 group by Grp;
  3. Сохраните скрипт и нажмите Загрузка, чтобы загрузить данные.

Отображение результатов из вычислений скрипта

Выполните следующие действия.

  1. Добавьте на лист простую таблицу и выберите для отображения следующие поля:

    • Linest_B
    • Linest_DF
    • Linest_F
    • Linest_M
    • Linest_R2
    • Linest_SEB
    • Linest_SEM
    • Linest_SEY
    • Linest_SSREG
    • Linest_SSRESID

Таблица, содержащая результаты вычислений linest, выполненных в скрипте загрузки, должна выглядеть так:

Linest_B Linest_DF Linest_F Linest_M Linest_R2 Linest_SEB
-35.047 18 20.788 8.605 0.536 22.607

Linest_SEM Linest_SEY Linest_SSREG Linest_SSRESID
1.887 48.666 49235.014 42631.186

Создание диаграмм функции диаграммы linest

Выполните следующие действия.

  1. Добавьте линейный график, затем добавьте элемент X в качестве измерения и элемент Sum(Y) в качестве меры.

    Линейный график создан для представления графика элемента X, нанесенного напротив элемента Y, из которого вычисляются функции linest.

  2. Для выражения Sum(Y) включите функцию линии линейного тренда и установите флажок «Показать уравнение».

    После этого в приложении QlikView (и Qlik Sense) отобразится встроенная линия максимального соответствия описанной функции линейной регрессии.

  3. Вычислите функцию линейной регрессии с помощью добавления к функциям linest_b и linest_m второго выражения, определенного как:

    $(=LINEST_M(Y,X))*ONLY(X)+$(=LINEST_B(Y,X))

  4. Добавьте на лист прямую таблицу и следующие значения в качестве вычисляемых измерений:

    ValueList('Linest_b', 'Linest_df','Linest_f', 'Linest_m','Linest_r2','Linest_SEB','Linest_SEM','Linest_SEY','Linest_SSREG','Linest_SSRESID')

    В данном случае используется функция синтетических измерений для создания меток для измерений с именами функций linest. Для экономии места метку можно изменить на Linest functions.

  5. Добавьте следующее выражение в таблицу в качестве меры:

    Pick(Match(ValueList('Linest_b', 'Linest_df','Linest_f', 'Linest_m','Linest_r2','Linest_SEB','Linest_SEM','Linest_SEY','Linest_SSREG','Linest_SSRESID'),'Linest_b', 'Linest_df','Linest_f', 'Linest_m','Linest_r2','Linest_SEB','Linest_SEM','Linest_SEY','Linest_SSREG','Linest_SSRESID'),Linest_b(Y,X),Linest_df(Y,X),Linest_f(Y,X),Linest_m(Y,X),Linest_r2(Y,X),Linest_SEB(Y,X,1,1),Linest_SEM(Y,X),Linest_SEY(Y,X),Linest_SSREG(Y,X),Linest_SSRESID(Y,X) )

    В данном случае отображается значение результата каждой функции linest напротив соответствующего имени в синтетическом измерении. Результат функции Linest_b(Y,X) отображается рядом с linest_b и так далее.

Результат

Linest functions Linest function results
Linest_b -35.047
Linest_df 18
Linest_f 20.788
Linest_m 8.605
Linest_r2 0.536
Linest_SEB 22.607
Linest_SEM 1.887
Linest_SEY 48.666
Linest_SSREG 49235.014
Linest_SSRESID 42631.186

Статистические функции тестирования

В этом разделе описаны функции для статистических тестов, поделенных на три категории. Функции можно использовать как в скрипте загрузки, так и в выражениях диаграмм, но синтаксис имеет различия.

Функции критерия Хи-квадрат

Обычно используются при изучении качественных переменных. Можно сравнить полученные частоты в односторонней таблице частот с ожидаемыми частотами или изучить связь двух переменных в таблице вероятности.

Функции t-критерия

Функции t-критерия используются для статистического исследования двух генеральных средних. T-критерий для двух выборок проверяет, отличаются ли эти выборки. Он обычно используется, когда два нормальных распределения имеют неизвестные изменения, и когда в эксперименте используется малый размер выборки.

Функции z-критерия

Статистическое исследование двух генеральных средних. Z-критерий для двух выборок проверяет, отличаются ли две выборки. Он обычно используется, когда два нормальных распределения имеют известные изменения, и когда в эксперименте используется большой размер выборки.

Функции критерия Хи-2

Обычно используются при изучении качественных переменных. Можно сравнить полученные частоты в односторонней таблице частот с ожидаемыми частотами или изучить связь двух переменных в таблице вероятности.

Пользуйтесь информацией из раскрывающегося списка по каждой функции, чтобы увидеть краткое описание и синтаксис каждой функции. Дополнительную информацию можно получить, если щелкнуть имя функции в описании синтаксиса.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Chi2Test_chi2

Функция Chi2Test_chi2() возвращает агрегированное значение критерия Хи-2 для одной или двух серий значений.

chi2test_chi2(col, row, actual_value[, expected_value])
Chi2Test_df

Функция Chi2Test_df() возвращает агрегированное df-значение критерия Хи-квадрат (степени свободы) для одной или двух серий значений.

chi2test_df(col, row, actual_value[, expected_value])
Chi2Test_p

Функция Chi2Test_p() возвращает агрегированное р-значение критерия Хи-квадрат (важность) для одной или двух серий значений.

chi2test_p(col, row, actual_value[, expected_value])

Chi2Test_chi2 — скрипт и функция диаграммы

Функция Chi2Test_chi2() возвращает агрегированное значение критерия Хи-2 для одной или двух серий значений.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Все QlikView (и Qlik Sense) функции chi2-критерия имеют одинаковые аргументы.

Синтаксис:
Chi2Test_chi2(col, row, actual_value[, expected_value])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
col, row Указанный столбец и строка в матрице значений тестируются.
actual_value Наблюдаемое значение данных при указанных элементах col и row.
expected_value Ожидаемое значение для распределения при указанных элементах col и row.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
Chi2Test_chi2( Grp, Grade, Count )
Chi2Test_chi2( Gender, Description, Observed, Expected )

Chi2Test_df — скрипт и функция диаграммы

Функция Chi2Test_df() возвращает агрегированное df-значение критерия Хи-квадрат (степени свободы) для одной или двух серий значений.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Все QlikView (и Qlik Sense) функции chi2-критерия имеют одинаковые аргументы.

Синтаксис:
Chi2Test_df(col, row, actual_value[, expected_value])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
col, row Указанный столбец и строка в матрице значений тестируются.
actual_value Наблюдаемое значение данных при указанных элементах col и row.
expected_value Ожидаемое значение для распределения при указанных элементах col и row.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
Chi2Test_df( Grp, Grade, Count )
Chi2Test_df( Gender, Description, Observed, Expected )

Chi2Test_p — функция диаграммы

Функция Chi2Test_p() возвращает агрегированное р-значение критерия Хи-квадрат (важность) для одной или двух серий значений. Данный тест может выполняться на основе значений в тестировании actual_value для отклонений в указанных матрицах col иrow или путем сравнения значений в элементе actual_value с соответствующими значениями в expected_value, если они указаны.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Все QlikView (и Qlik Sense) функции chi2-критерия имеют одинаковые аргументы.

Синтаксис:
Chi2Test_p(col, row, actual_value[, expected_value])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
col, row Указанный столбец и строка в матрице значений тестируются.
actual_value Наблюдаемое значение данных при указанных элементах col и row.
expected_value Ожидаемое значение для распределения при указанных элементах col и row.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
Chi2Test_p( Grp, Grade, Count )
Chi2Test_p( Gender, Description, Observed, Expected )

Функции t-критерия

Функции t-критерия используются для статистического исследования двух генеральных средних. T-критерий для двух выборок проверяет, отличаются ли эти выборки. Он обычно используется, когда два нормальных распределения имеют неизвестные изменения, и когда в эксперименте используется малый размер выборки.

В следующих разделах статистические тестовые функции t-критерия сгруппированы согласно образцу критерия Стьюдента, применяемого к каждому типу функции.

Пользуйтесь информацией из раскрывающегося списка по каждой функции, чтобы увидеть краткое описание и синтаксис каждой функции. Дополнительную информацию можно получить, если щелкнуть имя функции в описании синтаксиса.

T-критерии для двух независимых выборок

Следующие функции применяются к t-критериям Стьюдента для двух независимых выборок.

ttest_conf

Функция TTest_conf возвращает агрегированное значение доверительного интервала t-критерия для двух независимых выборок.

ttest_conf (grp, value [, sig[, eq_var]])
ttest_df

Функция TTest_df() возвращает агрегированное значение t-критерия Стьюдента (степени свободы) для двух независимых серий значений.

ttest_df (grp, value [, eq_var)
ttest_dif

Функция TTest_dif() — это числовая функция, которая возвращает агрегированное среднее значение разницы t-критерия Стьюдента для двух независимых серий значений.

ttest_dif (grp, value)
ttest_lower

Функция TTest_lower() возвращает агрегированное значение нижнего предела доверительного интервала для двух независимых серий значений.

ttest_lower (grp, value [, sig[, eq_var]])
ttest_sig

Функция TTest_sig() возвращает агрегированное значение двухвостого уровня важности t-критерия Стьюдента для двух независимых серий значений.

ttest_sig (grp, value [, eq_var])
ttest_sterr

Функция TTest_sterr() возвращает агрегированное среднее значение разницы стандартной ошибки t-критерия Стьюдента для двух независимых серий значений.

ttest_sterr (grp, value [, eq_var])
ttest_t

Функция TTest_t() возвращает агрегированное t-значение для двух независимых серий значений.

ttest_t (grp, value [, eq_var])
ttest_upper

Функция TTest_upper() возвращает агрегированное значение верхнего предела доверительного интервала для двух независимых серий значений.

ttest_upper (grp, value [, sig [, eq_var]])

T-критерии для двух независимых взвешенных выборок

Следующие функции применяются к t-критериям Стьюдента двух независимых выборок, где серия вводимых данных дается во взвешенном формате двух столбцов:

ttestw_conf

Функция TTestw_conf() возвращает агрегированное t-значение для двух независимых серий значений.

ttestw_conf (weight, grp, value [, sig[, eq_var]])
ttestw_df

Функция TTestw_df() возвращает агрегированное df-значение t-критерия Стьюдента (степени свободы) для двух независимых серий значений.

ttestw_df (weight, grp, value [, eq_var])
ttestw_dif

Функция TTestw_dif() возвращает агрегированное среднее значение разницы t-критерия Стьюдента для двух независимых серий значений.

ttestw_dif (weight, grp, value)
ttestw_lower

Функция TTestw_lower() возвращает агрегированное значение нижнего предела доверительного интервала для двух независимых серий значений.

ttestw_lower (weight, grp, value [, sig[, eq_var]])
ttestw_sig

Функция TTestw_sig() возвращает агрегированное значение двухвостого уровня важности t-критерия Стьюдента для двух независимых серий значений.

ttestw_sig (weight, grp, value [, eq_var])
ttestw_sterr

Функция TTestw_sterr() возвращает агрегированное среднее значение разницы стандартной ошибки t-критерия Стьюдента для двух независимых серий значений.

ttestw_sterr (weight, grp, value [, eq_var])
ttestw_t

Функция TTestw_t() возвращает агрегированное t-значение для двух независимых серий значений.

ttestw_t (weight, grp, value [, eq_var])
ttestw_upper

Функция TTestw_upper() возвращает агрегированное значение верхнего предела доверительного интервала для двух независимых серий значений.

ttestw_upper (weight, grp, value [, sig [, eq_var]])

T-критерии для одной выборки

Следующие функции применяются к t-критериям Стьюдента для одной выборки:

ttest1_conf

Функция TTest1_conf() возвращает агрегированное значение доверительного интервала для серии значений.

ttest1_conf (value [, sig])
ttest1_df

Функция TTest1_df() возвращает агрегированное df-значение t-критерия Стьюдента (степени свободы) для серии значений.

ttest1_df (value)
ttest1_dif

Функция TTest1_dif() возвращает агрегированное среднее значение разницы t-критерия Стьюдента для серии значений.

ttest1_dif (value)
ttest1_lower

Функция TTest1_lower() возвращает агрегированное значение нижнего предела доверительного интервала для серии значений.

ttest1_lower (value [, sig])
ttest1_sig

Функция TTest1_sig() возвращает агрегированное значение двухвостого уровня важности t-критерия Стьюдента для серии значений.

ttest1_sig (value)
ttest1_sterr

Функция TTest1_sterr() возвращает агрегированное среднее значение разницы стандартной ошибки t-критерия Стьюдента для серии значений.

ttest1_sterr (value)
ttest1_t

Функция TTest1_t() возвращает агрегированное t-значение для серии значений.

ttest1_t (value)
ttest1_upper

Функция TTest1_upper() возвращает агрегированное значение верхнего предела доверительного интервала для серии значений.

ttest1_upper (value [, sig])

T-критерии для одной взвешенной выборки

Следующие функции применяются к t-критериям Стьюдента для одной выборки, где серия вводимых данных дается во взвешенном формате двух столбцов:

ttest1w_conf

Функция TTest1w_conf() — это функция numeric, которая возвращает агрегированное значение доверительного интервала для серий значений.

ttest1w_conf (weight, value [, sig])
ttest1w_df

Функция TTest1w_df() возвращает агрегированное df-значение t-критерия Стьюдента (степени свободы) для серии значений.

ttest1w_df (weight, value)
ttest1w_dif

Функция TTest1w_dif() возвращает агрегированное среднее значение разницы t-критерия Стьюдента для серии значений.

ttest1w_dif (weight, value)
ttest1w_lower

Функция TTest1w_lower() возвращает агрегированное значение нижнего предела доверительного интервала для серии значений.

ttest1w_lower (weight, value [, sig])
ttest1w_sig

Функция TTest1w_sig() возвращает агрегированное значение двухвостого уровня важности t-критерия Стьюдента для серии значений.

ttest1w_sig (weight, value)
ttest1w_sterr

Функция TTest1w_sterr() возвращает агрегированное среднее значение разницы стандартной ошибки t-критерия Стьюдента для серии значений.

ttest1w_sterr (weight, value)
ttest1w_t

Функция TTest1w_t() возвращает агрегированное t-значение для серии значений.

ttest1w_t (weight, value)
ttest1w_upper

Функция TTest1w_upper() возвращает агрегированное значение верхнего предела доверительного интервала для серии значений.

ttest1w_upper (weight, value [, sig])

TTest_conf — скрипт и функция диаграммы

Функция TTest_conf возвращает агрегированное значение доверительного интервала t-критерия для двух независимых выборок.

Эта функция применяется к t-критериям Стьюдента для независимых выборок.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest_conf (grp, value [, sig [, eq_var]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTest_conf( Group, Value )
TTest_conf( Group, Value, Sig, false )

TTest_df — скрипт и функция диаграммы

Функция TTest_df() возвращает агрегированное значение t-критерия Стьюдента (степени свободы) для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для независимых выборок.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest_df (grp, value [, eq_var])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTest_df( Group, Value )
TTest_df( Group, Value, false )

TTest_dif — скрипт и функция диаграммы

Функция TTest_dif() — это числовая функция, которая возвращает агрегированное среднее значение разницы t-критерия Стьюдента для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для независимых выборок.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest_dif (grp, value[, eq_var] )

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTest_dif( Group, Value )
TTest_dif( Group, Value, false )

TTest_lower — скрипт и функция диаграммы

Функция TTest_lower() возвращает агрегированное значение нижнего предела доверительного интервала для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для независимых выборок.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest_lower (grp, value [, sig [, eq_var]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTest_lower( Group, Value )
TTest_lower( Group, Value, Sig, false )

TTest_sig — скрипт и функция диаграммы

Функция TTest_sig() возвращает агрегированное значение двухвостого уровня важности t-критерия Стьюдента для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для независимых выборок.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest_sig (grp, value [, eq_var])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTest_sig( Group, Value )
TTest_sig( Group, Value, false )

TTest_sterr — скрипт и функция диаграммы

Функция TTest_sterr() возвращает агрегированное среднее значение разницы стандартной ошибки t-критерия Стьюдента для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для независимых выборок.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest_sterr (grp, value [, eq_var])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTest_sterr( Group, Value )
TTest_sterr( Group, Value, false )

TTest_t — скрипт и функция диаграммы

Функция TTest_t() возвращает агрегированное t-значение для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для независимых выборок.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest_t(grp, value[, eq_var])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
TTest_t( Group, Value, false )

TTest_upper — скрипт и функция диаграммы

Функция TTest_upper() возвращает агрегированное значение верхнего предела доверительного интервала для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для независимых выборок.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest_upper (grp, value [, sig [, eq_var]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTest_upper( Group, Value )
TTest_upper( Group, Value, sig, false )

TTestw_conf — скрипт и функция диаграммы

Функция TTestw_conf() возвращает агрегированное t-значение для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для двух независимых выборок, в которых серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTestw_conf (weight, grp, value [, sig [, eq_var]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTestw_conf( Weight, Group, Value )
TTestw_conf( Weight, Group, Value, sig, false )

TTestw_df — скрипт и функция диаграммы

Функция TTestw_df() возвращает агрегированное df-значение t-критерия Стьюдента (степени свободы) для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для двух независимых выборок, в которых серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTestw_df (weight, grp, value [, eq_var])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTestw_df( Weight, Group, Value )
TTestw_df( Weight, Group, Value, false )

TTestw_dif — скрипт и функция диаграммы

Функция TTestw_dif() возвращает агрегированное среднее значение разницы t-критерия Стьюдента для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для двух независимых выборок, в которых серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTestw_dif (weight, group, value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTestw_dif( Weight, Group, Value )
TTestw_dif( Weight, Group, Value, false )

TTestw_lower — скрипт и функция диаграммы

Функция TTestw_lower() возвращает агрегированное значение нижнего предела доверительного интервала для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для двух независимых выборок, в которых серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTestw_lower (weight, grp, value [, sig [, eq_var]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
sig

В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.

eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTestw_lower( Weight, Group, Value )
TTestw_lower( Weight, Group, Value, sig, false )

TTestw_sig — скрипт и функция диаграммы

Функция TTestw_sig() возвращает агрегированное значение двухвостого уровня важности t-критерия Стьюдента для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для двух независимых выборок, в которых серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTestw_sig (weight, grp, value [, eq_var])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTestw_sig( Weight, Group, Value )
TTestw_sig( Weight, Group, Value, false )

TTestw_sterr — скрипт и функция диаграммы

Функция TTestw_sterr() возвращает агрегированное среднее значение разницы стандартной ошибки t-критерия Стьюдента для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для двух независимых выборок, в которых серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTestw_sterr (weight, grp, value [, eq_var])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTestw_sterr( Weight, Group, Value )
TTestw_sterr( Weight, Group, Value, false )

TTestw_t — скрипт и функция диаграммы

Функция TTestw_t() возвращает агрегированное t-значение для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для двух независимых выборок, в которых серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ttestw_t (weight, grp, value [, eq_var])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTestw_t( Weight, Group, Value )
TTestw_t( Weight, Group, Value, false )

TTestw_upper — скрипт и функция диаграммы

Функция TTestw_upper() возвращает агрегированное значение верхнего предела доверительного интервала для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для двух независимых выборок, в которых серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTestw_upper (weight, grp, value [, sig [, eq_var]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
sig

В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.

eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTestw_upper( Weight, Group, Value )
TTestw_upper( Weight, Group, Value, sig, false )

TTest1_conf — скрипт и функция диаграммы

Функция TTest1_conf() возвращает агрегированное значение доверительного интервала для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1_conf (value [, sig ])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTest1_conf( Value )
TTest1_conf( Value, 0.005 )

TTest1_df — скрипт и функция диаграммы

Функция TTest1_df() возвращает агрегированное df-значение t-критерия Стьюдента (степени свободы) для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1_df (value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
TTest1_df( Value )

TTest1_dif — скрипт и функция диаграммы

Функция TTest1_dif() возвращает агрегированное среднее значение разницы t-критерия Стьюдента для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1_dif (value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
TTest1_dif( Value )

TTest1_lower — скрипт и функция диаграммы

Функция TTest1_lower() возвращает агрегированное значение нижнего предела доверительного интервала для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1_lower (value [, sig])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTest1_lower( Value )
TTest1_lower( Value, 0.005 )

TTest1_sig — скрипт и функция диаграммы

Функция TTest1_sig() возвращает агрегированное значение двухвостого уровня важности t-критерия Стьюдента для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1_sig (value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
TTest1_sig( Value )

TTest1_sterr — скрипт и функция диаграммы

Функция TTest1_sterr() возвращает агрегированное среднее значение разницы стандартной ошибки t-критерия Стьюдента для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1_sterr (value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
TTest1_sterr( Value )

TTest1_t — скрипт и функция диаграммы

Функция TTest1_t() возвращает агрегированное t-значение для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1_t (value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
TTest1_t( Value )

TTest1_upper — скрипт и функция диаграммы

Функция TTest1_upper() возвращает агрегированное значение верхнего предела доверительного интервала для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1_upper (value [, sig])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTest1_upper( Value )
TTest1_upper( Value, 0.005 )

TTest1w_conf — скрипт и функция диаграммы

Функция TTest1w_conf() — это функция numeric, которая возвращает агрегированное значение доверительного интервала для серий значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки, в которой серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1w_conf (weight, value [, sig ])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTest1w_conf( Weight, Value )
TTest1w_conf( Weight, Value, 0.005 )

TTest1w_df — скрипт и функция диаграммы

Функция TTest1w_df() возвращает агрегированное df-значение t-критерия Стьюдента (степени свободы) для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки, в которой серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1w_df (weight, value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
TTest1w_df( Weight, Value )

TTest1w_dif — скрипт и функция диаграммы

Функция TTest1w_dif() возвращает агрегированное среднее значение разницы t-критерия Стьюдента для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки, в которой серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1w_dif (weight, value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
TTest1w_dif( Weight, Value )

TTest1w_lower — скрипт и функция диаграммы

Функция TTest1w_lower() возвращает агрегированное значение нижнего предела доверительного интервала для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки, в которой серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1w_lower (weight, value [, sig ])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTest1w_lower( Weight, Value )
TTest1w_lower( Weight, Value, 0.005 )

TTest1w_sig — скрипт и функция диаграммы

Функция TTest1w_sig() возвращает агрегированное значение двухвостого уровня важности t-критерия Стьюдента для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки, в которой серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1w_sig (weight, value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
TTest1w_sig( Weight, Value )

TTest1w_sterr — скрипт и функция диаграммы

Функция TTest1w_sterr() возвращает агрегированное среднее значение разницы стандартной ошибки t-критерия Стьюдента для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки, в которой серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1w_sterr (weight, value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
TTest1w_sterr( Weight, Value )

TTest1w_t — скрипт и функция диаграммы

Функция TTest1w_t() возвращает агрегированное t-значение для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки, в которой серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1w_t (weight, value)

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
TTest1w_t( Weight, Value )

TTest1w_upper — скрипт и функция диаграммы

Функция TTest1w_upper() возвращает агрегированное значение верхнего предела доверительного интервала для серии значений.

Эта функция применяется к t-критериям Стьюдента для одной выборки, в которой серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
TTest1w_upper (weight, value [, sig])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборки для оценки. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
weight Каждое значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
TTest1w_upper( Weight, Value )
TTest1w_upper( Weight, Value, 0.005 )

Функции z-критерия

Статистическое исследование двух генеральных средних. Z-критерий для двух выборок проверяет, отличаются ли две выборки. Он обычно используется, когда два нормальных распределения имеют известные изменения, и когда в эксперименте используется большой размер выборки.

Статистические тестовые функции z-критерия сгруппированы согласно типу серии вводимых данных, применяемой к функции.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Пользуйтесь информацией из раскрывающегося списка по каждой функции, чтобы увидеть краткое описание и синтаксис каждой функции. Дополнительную информацию можно получить, если щелкнуть имя функции в описании синтаксиса.

Функции формата одного столбца

Следующие функции применяются к z-критериям с простыми сериями вводимых данных:

ztest_conf

Функция ZTest_conf() возвращает агрегированное z-значение для серии значений.

ztest_conf (value [, sigma [, sig ])
ztest_dif

Функция ZTest_dif() возвращает агрегированное среднее значение разницы z-критерия для серии значений.

ztest_dif (value [, sigma])
ztest_sig

Функция ZTest_sig() возвращает агрегированное значение двухвостого уровня важности z-критерия для серии значений.

ztest_sig (value [, sigma])
ztest_sterr

Функция ZTest_sterr() возвращает агрегированное среднее значение разницы стандартной ошибки z-критерия для серии значений.

ztest_sterr (value [, sigma])
ztest_z

Функция ZTest_z() возвращает агрегированное z-значение для серии значений.

ztest_z (value [, sigma])
ztest_lower

Функция ZTest_lower() возвращает агрегированное значение нижнего предела доверительного интервала для двух независимых серий значений.

ztest_lower (grp, value [, sig [, eq_var]])
ztest_upper

Функция ZTest_upper() возвращает агрегированное значение верхнего предела доверительного интервала для двух независимых серий значений.

ztest_upper (grp, value [, sig [, eq_var]])

Функции взвешенного формата двух столбцов

Следующие функции применяются к z-критериям, в которых серия входных данных дается во взвешенном формате двух столбцов.

ztestw_conf

Функция ZTestw_conf() возвращает агрегированное значение доверительного интервала z-критерия для серии значений.

ztestw_conf (weight, value [, sigma [, sig]])
ztestw_dif

Функция ZTestw_dif() возвращает агрегированное среднее значение разницы z-критерия для серии значений.

ztestw_dif (weight, value [, sigma])
ztestw_lower

Функция ZTestw_lower() возвращает агрегированное значение нижнего предела доверительного интервала для двух независимых серий значений.

ztestw_lower (weight, value [, sigma])
ztestw_sig

Функция ZTestw_sig() возвращает агрегированное значение двухвостого уровня важности z-критерия для серии значений.

ztestw_sig (weight, value [, sigma])
ztestw_sterr

Функция ZTestw_sterr() возвращает агрегированное среднее значение разницы стандартной ошибки z-критерия для серии значений.

ztestw_sterr (weight, value [, sigma])
ztestw_upper

Функция ZTestw_upper() возвращает агрегированное значение верхнего предела доверительного интервала для двух независимых серий значений.

ztestw_upper (weight, value [, sigma])
ztestw_z

Функция ZTestw_z() возвращает агрегированное z-значение для серии значений.

ztestw_z (weight, value [, sigma])

ZTest_z — скрипт и функция диаграммы

Функция ZTest_z() возвращает агрегированное z-значение для серии значений.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTest_z(value[, sigma])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Принимается генеральное среднее 0. Чтобы выполнить проверку в отношении другого среднего значения, вычтите это значение из выборки значений.
sigma Если стандартное отклонение известно, его можно указать в элементе sigma. Если элемент sigma отсутствует, используется действительное стандартное отклонение выборки.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
ZTest_z( Value-TestValue )

ZTest_sig — скрипт и функция диаграммы

Функция ZTest_sig() возвращает агрегированное значение двухвостого уровня важности z-критерия для серии значений.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTest_sig(value[, sigma])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Принимается генеральное среднее 0. Чтобы выполнить проверку в отношении другого среднего значения, вычтите это значение из выборки значений.
sigma Если стандартное отклонение известно, его можно указать в элементе sigma. Если элемент sigma отсутствует, используется действительное стандартное отклонение выборки.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
ZTest_sig(Value-TestValue)

ZTest_dif — скрипт и функция диаграммы

Функция ZTest_dif() возвращает агрегированное среднее значение разницы z-критерия для серии значений.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTest_dif(value[, sigma])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Принимается генеральное среднее 0. Чтобы выполнить проверку в отношении другого среднего значения, вычтите это значение из выборки значений.
sigma Если стандартное отклонение известно, его можно указать в элементе sigma. Если элемент sigma отсутствует, используется действительное стандартное отклонение выборки.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
ZTest_dif(Value-TestValue)

ZTest_sterr — скрипт и функция диаграммы

Функция ZTest_sterr() возвращает агрегированное среднее значение разницы стандартной ошибки z-критерия для серии значений.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTest_sterr(value[, sigma])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Принимается генеральное среднее 0. Чтобы выполнить проверку в отношении другого среднего значения, вычтите это значение из выборки значений.
sigma Если стандартное отклонение известно, его можно указать в элементе sigma. Если элемент sigma отсутствует, используется действительное стандартное отклонение выборки.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
ZTest_sterr(Value-TestValue)

ZTest_conf — скрипт и функция диаграммы

Функция ZTest_conf() возвращает агрегированное z-значение для серии значений.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTest_conf(value[, sigma[, sig]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Принимается генеральное среднее 0. Чтобы выполнить проверку в отношении другого среднего значения, вычтите это значение из выборки значений.
sigma Если стандартное отклонение известно, его можно указать в элементе sigma. Если элемент sigma отсутствует, используется действительное стандартное отклонение выборки.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
ZTest_conf(Value-TestValue)

ZTest_lower — скрипт и функция диаграммы

Функция ZTest_lower() возвращает агрегированное значение нижнего предела доверительного интервала для двух независимых серий значений.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTest_lower (grp, value [, sig [, eq_var]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
ZTest_lower( Group, Value )
ZTest_lower( Group, Value, sig, false )

ZTest_upper — скрипт и функция диаграммы

Функция ZTest_upper() возвращает агрегированное значение верхнего предела доверительного интервала для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для независимых выборок.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTest_upper (grp, value [, sig [, eq_var]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
ZTest_upper( Group, Value )
ZTest_upper( Group, Value, sig, false )

ZTestw_z — скрипт и функция диаграммы

Функция ZTestw_z() возвращает агрегированное z-значение для серии значений.

Эта функция применяется к z-критериям, в которых серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTestw_z (weight, value [, sigma])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Эти значения возвращаются с помощью value. Принимается среднее значение выборки 0. Чтобы выполнить проверку в отношении другого среднего значения, вычтите это значение из выборки значений.
weight Каждое выборочное значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
sigma Если стандартное отклонение известно, его можно указать в элементе sigma. Если элемент sigma отсутствует, используется действительное стандартное отклонение выборки.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
ZTestw_z( Weight, Value-TestValue)

ZTestw_sig — скрипт и функция диаграммы

Функция ZTestw_sig() возвращает агрегированное значение двухвостого уровня важности z-критерия для серии значений.

Эта функция применяется к z-критериям, в которых серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTestw_sig (weight, value [, sigma])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Эти значения возвращаются с помощью value. Принимается среднее значение выборки 0. Чтобы выполнить проверку в отношении другого среднего значения, вычтите это значение из выборки значений.
weight Каждое выборочное значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
sigma Если стандартное отклонение известно, его можно указать в элементе sigma. Если элемент sigma отсутствует, используется действительное стандартное отклонение выборки.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
ZTestw_sig( Weight, Value-TestValue)

ZTestw_dif — скрипт и функция диаграммы

Функция ZTestw_dif() возвращает агрегированное среднее значение разницы z-критерия для серии значений.

Эта функция применяется к z-критериям, в которых серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTestw_dif ( weight, value [, sigma])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Эти значения возвращаются с помощью value. Принимается среднее значение выборки 0. Чтобы выполнить проверку в отношении другого среднего значения, вычтите это значение из выборки значений.
weight Каждое выборочное значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
sigma Если стандартное отклонение известно, его можно указать в элементе sigma. Если элемент sigma отсутствует, используется действительное стандартное отклонение выборки.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
ZTestw_dif( Weight, Value-TestValue)

ZTestw_sterr — скрипт и функция диаграммы

Функция ZTestw_sterr() возвращает агрегированное среднее значение разницы стандартной ошибки z-критерия для серии значений.

Эта функция применяется к z-критериям, в которых серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTestw_sterr (weight, value [, sigma])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Эти значения возвращаются с помощью value. Принимается среднее значение выборки 0. Чтобы выполнить проверку в отношении другого среднего значения, вычтите это значение из выборки значений.
weight Каждое выборочное значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
sigma Если стандартное отклонение известно, его можно указать в элементе sigma. Если элемент sigma отсутствует, используется действительное стандартное отклонение выборки.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
ZTestw_sterr( Weight, Value-TestValue)

ZTestw_conf — скрипт и функция диаграммы

Функция ZTestw_conf() возвращает агрегированное значение доверительного интервала z-критерия для серии значений.

Эта функция применяется к z-критериям, в которых серия входных данных дается во взвешенном формате двух столбцов.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTest_conf(weight, value[, sigma[, sig]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Принимается генеральное среднее 0. Чтобы выполнить проверку в отношении другого среднего значения, вычтите это значение из выборки значений.
weight Каждое выборочное значение в элементе value может подсчитываться один или несколько раз согласно соответствующему значению веса в элементе weight.
sigma Если стандартное отклонение известно, его можно указать в элементе sigma. Если элемент sigma отсутствует, используется действительное стандартное отклонение выборки.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Пример:
ZTestw_conf( Weight, Value-TestValue)

ZTestw_lower — скрипт и функция диаграммы

Функция ZTestw_lower() возвращает агрегированное значение нижнего предела доверительного интервала для двух независимых серий значений.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTestw_lower (grp, value [, sig [, eq_var]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
ZTestw_lower( Group, Value )
ZTestw_lower( Group, Value, sig, false )

ZTestw_upper — скрипт и функция диаграммы

Функция ZTestw_upper() возвращает агрегированное значение верхнего предела доверительного интервала для двух независимых серий значений.

Эта функция применяется к t-критериям Стьюдента для независимых выборок.

Если функция используется в скрипте загрузки, значения повторяются в нескольких записях, как определено предложением group by.

Если функция используется в выражении диаграммы, значения повторяются в измерениях диаграммы.

Синтаксис:
ZTestw_upper (grp, value [, sig [, eq_var]])

Тип возвращаемого значения: число

Аргументы:

Аргумент Описание
value Выборка значений для оценки. Значения выборки должны быть сгруппированы логически, как указано только двумя значениями в элементе group. Если имя поля для значений выборки не указано в скрипте загрузки, поле автоматически получит имя Value.
grp Поле, содержащее имена каждой из двух групп с выборками. Если имя поля для группы не указано в скрипте загрузки, поле автоматически получит имя Type.
sig В sig можно указать двусторонний уровень важности. При отсутствии значения sig устанавливается равным 0,025, что приводит к значению доверительного интервала 95%.
eq_var Если значение eq_var определено как False (0), будут приняты отдельные изменения двух выборок. Если значение eq_var определено как True (1), будут приняты равные изменения в выборках.

Ограничения:

Текстовые значения, значения NULL, а также отсутствующие значения в значении выражения приводят к тому, что функция возвращает значение NULL.

Примеры:
ZTestw_upper( Group, Value )
ZTestw_upper( Group, Value, sig, false )

Примеры статистических тестовых функций

В этом разделе указаны примеры статистических тестовых функций применительно к диаграммам и скрипту загрузки.

Примеры использования функций chi2-test в диаграммах

Функции chi2-test используются для обнаружения значений, связанных со статистическим анализом значения Хи-квадрат. В этом разделе описано, как построить диаграммы с помощью данных образца, чтобы найти значения функций теста распределения значения Хи-квадрат, доступных в программе QlikView (и Qlik Sense). Описание синтаксиса и аргументов см. в индивидуальных темах функций диаграммы chi2-test.

Загрузка данных для образцов

Существует три набора данных образца, описывающих три различных статистических образца для загрузки в скрипт.

Выполните следующие действия.

  1. Создайте новый документ.
  2. Выберите Редактор скрипта на панели инструментов и введите следующие элементы в скрипт:

    // Sample_1 data is pre-aggregated... Note: make sure you set your DecimalSep='.' at the top of the script.
    Sample_1:
    LOAD * inline [
    Grp,Grade,Count
    I,A,15
    I,B,7
    I,C,9
    I,D,20
    I,E,26
    I,F,19
    II,A,10
    II,B,11
    II,C,7
    II,D,15
    II,E,21
    II,F,16
    ];
    // Sample_2 data is pre-aggregated: If raw data is used, it must be aggregated using count()...
    Sample_2:
    LOAD * inline [
    Sex,Opinion,OpCount
    1,2,58
    1,1,11
    1,0,10
    2,2,35
    2,1,25
    2,0,23 ] (delimiter is ',');
    // Sample_3a data is transformed using the crosstable statement...
    Sample_3a:
    crosstable(Gender, Actual) LOAD
    Description,
    [Men (Actual)] as Men,
    [Women (Actual)] as Women;
    LOAD * inline [
    Men (Actual),Women (Actual),Description
    58,35,Agree
    11,25,Neutral
    10,23,Disagree ] (delimiter is ',');
    // Sample_3b data is transformed using the crosstable statement...
    Sample_3b:
    crosstable(Gender, Expected) LOAD
    Description,
    [Men (Expected)] as Men,
    [Women (Expected)] as Women;
    LOAD * inline [
    Men (Expected),Women (Expected),Description
    45.35,47.65,Agree
    17.56,18.44,Neutral
    16.09,16.91,Disagree ] (delimiter is ',');
    // Sample_3a and Sample_3b will result in a (fairly harmless) Synthetic Key...
  3. Сохраните скрипт и нажмите Загрузка, чтобы загрузить данные.
Создание диаграмм функции диаграммы chi2-test

Пример: Образец 1

Выполните следующие действия.

  1. Добавьте простую таблицу на лист, затем добавьте параметры Grp, Grade и Count в качестве измерений.

    В этой таблице показаны данные образца.

  2. Добавьте прямую таблицу со следующим вычисляемым измерением:

    ValueList('p','df','Chi2')

    В данном случае используется функция синтетического измерения для создания меток для измерений с именами трех функций chi2-test.

  3. Добавьте следующее выражение:

    IF(ValueList('p','df','Chi2')='p',Chi2Test_p(Grp,Grade,Count),
    IF(ValueList('p','df','Chi2')='df',Chi2Test_df(Grp,Grade,Count),
    Chi2Test_Chi2(Grp,Grade,Count)))

    В таком случае результирующее значение каждой функции chi2-test будет помещено в таблицу рядом со связанным с ним синтетическим измерением.

  4. Задайте для выражения значение параметра формата числа Number и значение параметра Precision, равное 3.

В выражении вместо этого можно использовать следующее выражение:
Pick(Match(ValueList('p','df','Chi2'),'p','df','Chi2'),Chi2Test_p(Grp,Grade,Count),
Chi2Test_df(Grp,Grade,Count),Chi2Test_Chi2(Grp,Grade,Count))

Результат:

Полученная в результате таблица для функций chi2-test для данных образца 1 будет содержать следующие значения:

p df Chi2
0.820 5 2.21

Пример: Образец 2

Выполните следующие действия.

  1. Добавьте на лист другую таблицу с параметрами Sex, Opinion и OpCount в качестве измерений.
  2. Сделайте копию прямой таблицы результатов из образца 1 с помощью команд Копировать в буфер обмена:/Объект и Вставить объект листа. Измените выражение и замените аргументы во всех трех функциях chi2-test с именами полей, используемыми в данных образца 2, например: Chi2Test_p(Sex,Opinion,OpCount).

Результат:

Полученная в результате таблица для функций chi2-test для данных образца 2 будет содержать следующие значения:

p df Chi2
0.000309 2 16.2

Пример: Образец 3

Выполните следующие действия.

  1. Создайте еще две простые таблицы так же, как в примерах для данных образцов 1 и 2. В простой таблице используйте следующие поля в качестве измерений: Gender, Description, Actual и Expected.
  2. В прямой таблице результатов используйте имена полей, используемые в данных образца 3, например: Chi2Test_p(Gender,Description,Actual,Expected).

Результат:

Полученная в результате таблица для функций chi2-test для данных образца 3 будет содержать следующие значения:

p df Chi2
0.000308 2 16.2

Примеры использования функций chi2-test в скрипте загрузки

Функции chi2-test используются для обнаружения значений, связанных со статистическим анализом значения Хи-квадрат. В этом разделе описано, как использовать функции теста распределения значения Хи-квадрат, доступные в QlikView (и Qlik Sense) в скрипте загрузки. Описание синтаксиса и аргументов см. в индивидуальных темах функций скрипта chi2-test.

В этом примере используется таблица, содержащая количество студентов, достигших степени (A-F), для двух групп студентов (I и II).

a b c d e f
i 15 7 9 20 26 19
ii 10 11 7 15 21 16

Загрузка данных образца

Выполните следующие действия.

  1. Создайте новый документ.
  2. Выберите Редактор скрипта на панели инструментов и введите следующие элементы в скрипт:

    // Sample_1 data is pre-aggregated... Note: make sure you set your DecimalSep='.' at the top of the script.
    Sample_1:
    LOAD * inline [
    Grp,Grade,Count
    I,A,15
    I,B,7
    I,C,9
    I,D,20
    I,E,26
    I,F,19
    II,A,10
    II,B,11
    II,C,7
    II,D,15
    II,E,21
    II,F,16
    ];
  3. Сохраните скрипт и нажмите Загрузка, чтобы загрузить данные.

Данные образца загружены.

Загрузка значений функции chi2-test

Теперь мы загрузим значения chi2-test на основе данных образца в новой таблице, сгруппированных по элементу Grp.

Выполните следующие действия.

  1. Выберите Редактор скрипта на панели инструментов и добавьте следующие элементы в конец скрипта:

    // Sample_1 data is pre-aggregated... Note: make sure you set your DecimalSep='.' at the top of the script.
    Chi2_table:
    LOAD Grp,
    Chi2Test_chi2(Grp, Grade, Count) as chi2,
    Chi2Test_df(Grp, Grade, Count) as df,
    Chi2Test_p(Grp, Grade, Count) as p
    resident Sample_1 group by Grp;
  2. Сохраните скрипт и нажмите Загрузка, чтобы загрузить данные.

Значения chi2-test загружены в таблицу с именем Chi2_table.

Результаты

Полученные значения chi2-test можно просмотреть в обозревателе таблиц. Они должны выглядеть так:

Grp chi2 df p
I 16.00 5 0.007
II 9.40 5 0.094

Создание типичного отчета t-test

Типичный отчет Стьюдента t-test может включать таблицы с результатами Group Statistics и Independent Samples Test. В следующих разделах мы построим эти таблицы с помощью функций программы QlikView (и Qlik Sense) t-test, применяемых к двум независимым группам образцов: Observation и Comparison. Соответствующие таблицы для этих образцов будут выглядеть следующим образом:

Group Statistics

type n mean standard deviation standard error mean
comparison 20 11.95 14.61245 3.2674431
observation 20 27.15 12.507997 2.7968933

independent sample test

t df sig. (2-tailed) mean difference standard error difference 95% confidence interval of the difference (lower) 95% confidence interval of the difference (upper)
equal variance not assumed 3.534 37.116717335823 0.001 15.2 4.30101 6.48625 23.9137
equal variance assumed 3.534 38 0.001 15.2 4.30101 6.49306 23.9069
Загрузка данных образца

Выполните следующие действия.

  1. Создайте новый документ.
  2. Выберите Редактор скрипта на панели инструментов и введите следующие элементы в скрипт:

    Table1:
    crosstable LOAD recno() as ID, * inline [
    Observation|Comparison
    35|2
    40|27
    12|38
    15|31
    21|1
    14|19
    46|1
    10|34
    28|3
    48|1
    16|2
    30|3
    32|2
    48|1
    31|2
    22|1
    12|3
    39|29
    19|37
    25|2 ] (delimiter is '|');

    В скрипт загрузки включена функция recno(), поскольку для таблицы crosstable требуется три аргумента. Поэтому функция recno() просто обеспечивает дополнительный аргумент, в данном случае идентификатор для каждой строки. Без этого значения выборки Comparison не будут загружены.

  3. Сохраните скрипт и нажмите Загрузка, чтобы загрузить данные.
Создание таблицы Group Statistics

Выполните следующие действия.

  1. Добавьте на лист прямую таблицу и выберите Type в качестве измерения.

  2. Добавьте следующие выражения:

  3. Метка Выражение
    N Count(Value)
    Mean Avg(Value)
    Standard Deviation Stdev(Value)
    Standard Error Mean Sterr(Value)
  4. Убедитесь, что параметр Type находится в верхней части списка сортировки.
  5. Результат:

    Таблица Group Statistics для этих образцов будет выглядеть следующим образом:

    Type N Mean Standard Deviation Standard Error Mean
    Comparison 20 11.95 14.61245 3.2674431
    Observation 20 27.15 12.507997 2.7968933

Создание таблицы Two Independent Sample Student's T-test

Выполните следующие действия.

  1. Добавьте таблицу на лист.
  2. Добавьте следующее вычисляемое измерение в таблицу в качестве измерения. =ValueList (Dual('Equal Variance not Assumed', 0), Dual('Equal Variance Assumed', 1))

  3. Добавьте следующие выражения:

    Метка Выражение
    conf if(ValueList (Dual('Equal Variance not Assumed', 0), Dual('Equal Variance Assumed', 1)),TTest_conf(Type, Value),TTest_conf(Type, Value, 0))
    t if(ValueList (Dual('Equal Variance not Assumed', 0), Dual('Equal Variance Assumed', 1)),TTest_t(Type, Value),TTest_t(Type, Value, 0))
    df if(ValueList (Dual('Equal Variance not Assumed', 0), Dual('Equal Variance Assumed', 1)),TTest_df(Type, Value),TTest_df(Type, Value, 0))
    Sig. (2-tailed) if(ValueList (Dual('Equal Variance not Assumed', 0), Dual('Equal Variance Assumed', 1)),TTest_sig(Type, Value),TTest_sig(Type, Value, 0))
    Mean Difference TTest_dif(Type, Value)
    Standard Error Difference if(ValueList (Dual('Equal Variance not Assumed', 0), Dual('Equal Variance Assumed', 1)),TTest_sterr(Type, Value),TTest_sterr(Type, Value, 0))
    95% Confidence Interval of the Difference (Lower) if(ValueList (Dual('Equal Variance not Assumed', 0), Dual('Equal Variance Assumed', 1)),TTest_lower(Type, Value,(1-(95)/100)/2),TTest_lower(Type, Value,(1-(95)/100)/2, 0))
    95% Confidence Interval of the Difference (Upper) if(ValueList (Dual('Equal Variance not Assumed', 0), Dual('Equal Variance Assumed', 1)),TTest_upper(Type, Value,(1-(95)/100)/2),TTest_upper(Type, Value,(1-(95)/100)/2, 0))

    Результат:

    Таблица Independent Sample Test для этих образцов будет выглядеть следующим образом:

    t df Sig. (2-tailed) Mean Difference Standard Error Difference 95% Confidence Interval of the Difference (Lower) 95% Confidence Interval of the Difference (Upper)
    Equal Variance not Assumed 3.534 37.116717335823 0.001 15.2 4.30101 6.48625 23.9137
    Equal Variance Assumed 3.534 38 0.001 15.2 4.30101 6.49306 23.9069

Примеры использования функций z-test

Функции z-test используются для обнаружения значений, связанных со статистическим анализом z-test для больших выборок данных, обычно больше 30, и где изменения известны. В этом разделе описано, как построить диаграммы с помощью данных образца, чтобы найти значения функций z-test, доступных в программе QlikView (и Qlik Sense). Описание синтаксиса и аргументов см. в индивидуальных темах функций диаграммы z-test.

Загрузка данных образца

Данные образца, используемые здесь, такие же, как данные, используемые в примерах функции t-test. Размер данных образца обычно считается слишком маленьким для анализа z-критериев, но он достаточен для иллюстрации использования различных функций z-test в программе QlikView.

Выполните следующие действия.

  1. Создайте новый документ.
  2. Если создан документ для функций t-test, его можно использовать и создать новый лист для этих функций.
  3. Выберите Редактор скрипта на панели инструментов и введите следующие элементы в скрипт:

    Table1:
    crosstable LOAD recno() as ID, * inline [
    Observation|Comparison
    35|2
    40|27
    12|38
    15|31
    21|1
    14|19
    46|1
    10|34
    28|3
    48|1
    16|2
    30|3
    32|2
    48|1
    31|2
    22|1
    12|3
    39|29
    19|37
    25|2 ] (delimiter is '|');

    В скрипт загрузки включена функция recno(), поскольку для таблицы crosstable требуется три аргумента. Поэтому функция recno() просто обеспечивает дополнительный аргумент, в данном случае идентификатор для каждой строки. Без этого значения выборки Comparison не будут загружены.

  4. Сохраните скрипт и нажмите Загрузка, чтобы загрузить данные.
Создание диаграмм функции диаграммы z-test

Выполните следующие действия.

  1. Добавьте на лист прямую таблицу и выберите Type в качестве измерения.

  2. Добавьте следующие выражения:

  3. Метка Выражение
    ZTest Conf ZTest_conf(Value)
    ZTest Dif ZTest_dif(Value)
    ZTest Sig ZTest_sig(Value)
    ZTest Sterr ZTest_sterr(Value)
    ZTest Z ZTest_z(Value)
Может возникнуть необходимость откорректировать форматирование числа мер, чтобы увидеть значимые значения. Таблицу будет легче считывать, если для большинства выражений установить фиксированное число десятичных знаков после запятой, равное 2 знакам. Однако, например, для ZTest Sig следует использовать формат чисел: Number, а затем выбрать образец формата # ##.

Результат:

Полученная в результате таблица для функций z-test для данных образца будет содержать следующие значения:

Type ZTest Conf ZTest Dif ZTest Sig ZTest Sterr ZTest Z
Comparison 6.40 11.95 0.000123 3.27 3.66
Value 5.48 27.15 0.001 2.80 9.71

Создание диаграмм функции диаграммы z-testw

Функции z-testw используются, когда серии вводимых данных встречаются в формате двух столбцов. Выражения требуют значение для аргумента weight. Во всех этих примерах используется значение 2, но можно использовать выражение, которое определит значение для элемента weight при каждом просмотре.

Примеры и результаты:

При использовании одинаковых данных образца и формата чисел, как для функций z-test, результирующая таблица для функций z-testw будет содержать следующие значения:

Type ZTestw Conf ZTestw Dif ZTestw Sig ZTestw Sterr ZTestw Z
Comparison 3.53 2.95 5.27e-005 1.80 3.88
Value 2.97 34.25 0 4.52 20.49

Строковые функции агрегирования

В этом разделе описаны функции агрегирования, относящиеся к строкам.

Пользуйтесь информацией из раскрывающегося списка по каждой функции, чтобы увидеть краткое описание и синтаксис каждой функции. Дополнительную информацию можно получить, если щелкнуть имя функции в описании синтаксиса.

Строковые функции агрегирования в скрипте загрузки

Concat

Функция Concat() используется для объединения строковых значений. Эта функция скрипта возвращает агрегированное объединение строк всех значений выражения, повторяемого в нескольких записях, как определено предложением group by.

concat([ distinct ] expression [, delimiter [, sort-weight]])

FirstValue

Функция FirstValue() возвращает значение, загруженное первым из записей, определенных выражением, отсортированным по предложению group by.

Эта функция доступна только как функция скрипта.

FirstValue (expression)

LastValue

Функция LastValue() возвращает значение, загруженное последним из записей, определенных выражением, отсортированным по предложению group by.

Эта функция доступна только как функция скрипта.

LastValue (expression)

MaxString

Функция MaxString() находит строковые значения в выражении и возвращает последнее текстовое значение, отсортированное в нескольких записях, как определено предложением group by.

MaxString(expression)

MinString

Функция MaxString() находит строковые значения в выражении и возвращает первое текстовое значение, отсортированное в нескольких записях, как определено предложением group by.

MinString(expression)

Строковые функции агрегирования в диаграммах

Следующие функции диаграммы доступны для агрегирования строк в диаграммах.

Concat

Функция Concat() используется для объединения строковых значений. Функция возвращает агрегированное объединение строк всех значений выражения, оцениваемого по каждому измерению.

concat({[SetExpression] [DISTINCT] [TOTAL [<fld{, fld}>]] string[, delimiter[, sort_weight]])

MaxString

Функция MaxString() находит строковые значения в выражении или поле и возвращает последнее текстовое значение в порядке сортировки текста.

maxstring({[SetExpression] [TOTAL [<fld{, fld}>]]} expr)

MinString

Функция MinString() находит строковые значения в выражении или поле и возвращает первое текстовое значение в порядке сортировки текста.

minstring({[SetExpression] [TOTAL [<fld {, fld}>]]} expr)

Concat — функция скрипта

Функция Concat() используется для объединения строковых значений. Эта функция скрипта возвращает агрегированное объединение строк всех значений выражения, повторяемого в нескольких записях, как определено предложением group by.

Синтаксис:
Concat ([ distinct ] string [, delimiter [, sort-weight]])

Тип возвращаемого значения: строка

Аргументы:

Выражение или поле, содержащее строку для обработки.

Аргумент Описание
string

Выражение или поле, содержащее строку для обработки.

delimiter Каждое значение может быть разделено строкой, найденной в delimiter.
sort-weight

Порядок объединения может быть определен значением измерения sort-weight при его наличии со строкой, соответствующей наименьшему значению, появляющемуся в объединении первым.

distinct Если слово distinct указано перед выражением, все дубликаты будут проигнорированы.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
TeamData:
LOAD * inline [
SalesGroup|Team|Date|Amount
East|Gamma|01/05/2013|20000
East|Gamma|02/05/2013|20000
West|Zeta|01/06/2013|19000
East|Alpha|01/07/2013|25000
East|Delta|01/08/2013|14000
West|Epsilon|01/09/2013|17000
West|Eta|01/10/2013|14000
East|Beta|01/11/2013|20000
West|Theta|01/12/2013|23000
] (delimiter is '|');

Concat1:
LOAD SalesGroup,Concat(Team) as TeamConcat1 Resident TeamData Group By SalesGroup;

SalesGroup

East

West

TeamConcat1

AlphaBetaDeltaGammaGamma

EpsilonEtaThetaZeta

При условии, что таблица TeamData загружается, как в предыдущем примере:

LOAD SalesGroup,Concat(distinct Team,'-') as TeamConcat2 Resident TeamData Group By SalesGroup;

SalesGroup

East

West

TeamConcat2

Alpha-Beta-Delta-Gamma

Epsilon-Eta-Theta-Zeta

При условии, что таблица TeamData загружается, как в предыдущем примере:

LOAD SalesGroup,Concat(distinct Team,'-',Amount) as TeamConcat2 Resident TeamData Group By SalesGroup;
Поскольку аргумент для элемента sort-weight добавлен, порядок результатов определяется значением измерения Amount.

SalesGroup

East

West

TeamConcat2

Delta-Beta-Gamma-Alpha

Eta-Epsilon-Zeta-Theta

Concat — функция диаграммы

Функция Concat() используется для объединения строковых значений. Функция возвращает агрегированное объединение строк всех значений выражения, оцениваемого по каждому измерению.

Синтаксис:
Concat({[SetExpression] [DISTINCT] [TOTAL [<fld{, fld}>]] string[, delimiter[, sort_weight]])

Тип возвращаемого значения: строка

Аргументы:

Аргумент Описание
string

Выражение или поле, содержащее строку для обработки.

delimiter Каждое значение может быть разделено строкой, найденной в delimiter.
sort-weight

Порядок объединения может быть определен значением измерения sort-weight при его наличии со строкой, соответствующей наименьшему значению, появляющемуся в объединении первым.

SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

См.: Определение объема агрегирования

Примеры и результаты:
SalesGroup Amount Concat(Team) Concat(TOTAL <SalesGroup> Team)
East 25000 Alpha AlphaBetaDeltaGammaGamma
East 20000 BetaGammaGamma AlphaBetaDeltaGammaGamma
East 14000 Delta AlphaBetaDeltaGammaGamma
West 17000 Epsilon EpsilonEtaThetaZeta
West 14000 Eta EpsilonEtaThetaZeta
West 23000 Theta EpsilonEtaThetaZeta
West 19000 Zeta EpsilonEtaThetaZeta

Пример Результат
Concat(Team)

Таблица состоит из измерений SalesGroup и Amount и вариантов меры Concat(Team). Игнорируя результат "Итоги", обратите внимание, что несмотря на то, что существуют данные для восьми значений элемента Team, разбросанные по двум значениям элемента SalesGroup, единственным результатом мерыConcat(Team), которая объединяет больше одного значения строки Team в таблице, является строка, содержащая измерение Amount 20000, результатом которого является BetaGammaGamma. Это обусловлено тем, что во входных данных существует три значения для измерения Amount 20 000. Все прочие результаты остаются не связанными, если мера заполнена по всем измерениям, поскольку существует только одно значение элемента Team для каждой комбинации элементов SalesGroup и Amount.

Concat(DISTINCT Team,', ') Элементы Beta, Gamma, поскольку префикс DISTINCT означает что результат дубликата Gamma игнорируется. Также аргумент ограничителя определяется как запятая, после которой стоит пробел.
Concat (TOTAL <SalesGroup> Team) Все значения строки для всех значений элемента Team связаны, если используется префикс TOTAL. Если указана выборка поля <SalesGroup>, результаты делятся на два значения измерения SalesGroup. Для элемента SalesGroup East результатами являются AlphaBetaDeltaGammaGamma. Для элемента SalesGroup West результатами являются EpsilonEtaThetaZeta.
Concat (TOTAL <SalesGroup> Team,';', Amount) При добавлении аргумента для элемента sort-weight: Amount результаты упорядочиваются значением измерения Amount. Результатом становятся значения DeltaBetaGammaGammaAlpha и EtaEpsilonZEtaTheta.

Данные, используемые в примере:

TeamData:
LOAD * inline [
SalesGroup|Team|Date|Amount
East|Gamma|01/05/2013|20000
East|Gamma|02/05/2013|20000
West|Zeta|01/06/2013|19000
East|Alpha|01/07/2013|25000
East|Delta|01/08/2013|14000
West|Epsilon|01/09/2013|17000
West|Eta|01/10/2013|14000
East|Beta|01/11/2013|20000
West|Theta|01/12/2013|23000
] (delimiter is '|');

FirstValue — функция скрипта

Функция FirstValue() возвращает значение, загруженное первым из записей, определенных выражением, отсортированным по предложению group by.

Эта функция доступна только как функция скрипта.

Синтаксис:
FirstValue ( expr)

Тип возвращаемого значения: dual

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.

Ограничения:

Если текстовые значения не найдены, возвращается значение NULL.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
TeamData:
LOAD * inline [
SalesGroup|Team|Date|Amount
East|Gamma|01/05/2013|20000
East|Gamma|02/05/2013|20000
West|Zeta|01/06/2013|19000
East|Alpha|01/07/2013|25000
East|Delta|01/08/2013|14000
West|Epsilon|01/09/2013|17000
West|Eta|01/10/2013|14000
East|Beta|01/11/2013|20000
West|Theta|01/12/2013|23000
] (delimiter is '|');

FirstValue1:
LOAD SalesGroup,FirstValue(Team) as FirstTeamLoaded Resident TeamData Group By SalesGroup;

SalesGroup

East

West

FirstTeamLoaded

Gamma

Zeta

LastValue — функция скрипта

Функция LastValue() возвращает значение, загруженное последним из записей, определенных выражением, отсортированным по предложению group by.

Эта функция доступна только как функция скрипта.

Синтаксис:
LastValue ( expr )

Тип возвращаемого значения: dual

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.

Ограничения:

Если текстовые значения не найдены, возвращается значение NULL.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
TeamData:
LOAD * inline [
SalesGroup|Team|Date|Amount
East|Gamma|01/05/2013|20000
East|Gamma|02/05/2013|20000
West|Zeta|01/06/2013|19000
East|Alpha|01/07/2013|25000
East|Delta|01/08/2013|14000
West|Epsilon|01/09/2013|17000
West|Eta|01/10/2013|14000
East|Beta|01/11/2013|20000
West|Theta|01/12/2013|23000
] (delimiter is '|');

LastValue1:
LOAD SalesGroup,LastValue(Team) as LastTeamLoaded Resident TeamData Group By SalesGroup;

SalesGroup

East

West

LastTeamLoaded

Beta

Theta

MaxString — функция скрипта

Функция MaxString() находит строковые значения в выражении и возвращает последнее текстовое значение, отсортированное в нескольких записях, как определено предложением group by.

Синтаксис:
MaxString ( expr)

Тип возвращаемого значения: dual

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.

Ограничения:

Если текстовые значения не найдены, возвращается значение NULL.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
TeamData:
LOAD * inline [
SalesGroup|Team|Date|Amount
East|Gamma|01/05/2013|20000
East|Gamma|02/05/2013|20000
West|Zeta|01/06/2013|19000
East|Alpha|01/07/2013|25000
East|Delta|01/08/2013|14000
West|Epsilon|01/09/2013|17000
West|Eta|01/10/2013|14000
East|Beta|01/11/2013|20000
West|Theta|01/12/2013|23000
] (delimiter is '|');

Concat1:
LOAD SalesGroup,MaxString(Team) as MaxString1 Resident TeamData Group By SalesGroup;

SalesGroup

East

West

MaxString1

Gamma

Zeta

При условии, что таблица TeamData загружается как в предыдущем примере, а текущий скрипт загрузки имеет оператор SET statement:
SET DateFormat='DD/MM/YYYY';':
LOAD SalesGroup,MaxString(Date) as MaxString2 Resident TeamData Group By SalesGroup;

SalesGroup

East

West

MaxString2

01/11/2013

01/12/2013

MaxString — функция диаграммы

Функция MaxString() находит строковые значения в выражении или поле и возвращает последнее текстовое значение в порядке сортировки текста.

Синтаксис:
MaxString({[SetExpression] [TOTAL [<fld{, fld}>]]} expr)

Тип возвращаемого значения: dual

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

См.: Определение объема агрегирования

Ограничения:

Если выражение не содержит значений со строковым представлением, возвращается значение NULL .

Примеры и результаты:
SalesGroup Amount MaxString(Team) MaxString(Date)
East 14000 Delta 2013/08/01
East 20000 Gamma 2013/11/01
East 25000 Alpha 2013/07/01
West 14000 Eta 2013/10/01
West 17000 Epsilon 2013/09/01
West 19000 Zeta 2013/06/01
West 23000 Theta 2013/12/01

В таблице представлены все значения измерения Customer с соответствующими значениями Product. На диаграмме фактической таблицы на листе будет отображена строка для каждого значения элементов Customer и Product.

Пример Результат
MaxString(Team)

Существует три значения 20000 для измерения Amount: два измерения элемента Gamma (с различными датами), и одно элемента Beta. Таким образом, результатом меры MaxString (Team) является элемент Gamma, поскольку это наибольшее значение в отсортированных строках.

MaxString(Date) 2013/11/01 является самым большим значением Date из трех, ассоциированных с измерением Amount. Так предполагается, что ваш скрипт имеет оператор SET SET DateFormat='YYYY-MM-DD';

Данные, используемые в примере:

TeamData:
LOAD * inline [
SalesGroup|Team|Date|Amount
East|Gamma|01/05/2013|20000
East|Gamma|02/05/2013|20000
West|Zeta|01/06/2013|19000
East|Alpha|01/07/2013|25000
East|Delta|01/08/2013|14000
West|Epsilon|01/09/2013|17000
West|Eta|01/10/2013|14000
East|Beta|01/11/2013|20000
West|Theta|01/12/2013|23000
] (delimiter is '|');

MinString — функция скрипта

Функция MaxString() находит строковые значения в выражении и возвращает первое текстовое значение, отсортированное в нескольких записях, как определено предложением group by.

Синтаксис:
MinString ( expr )

Тип возвращаемого значения: dual

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.

Ограничения:

Если текстовые значения не найдены, возвращается значение NULL.

Примеры и результаты:

Добавьте образец скрипта в свой документ и запустите. Затем добавьте на лист документа как минимум поля, указанные в столбце с результатами, чтобы увидеть результаты.

Пример Результат
TeamData:
LOAD * inline [
SalesGroup|Team|Date|Amount
East|Gamma|01/05/2013|20000
East|Gamma|02/05/2013|20000
West|Zeta|01/06/2013|19000
East|Alpha|01/07/2013|25000
East|Delta|01/08/2013|14000
West|Epsilon|01/09/2013|17000
West|Eta|01/10/2013|14000
East|Beta|01/11/2013|20000
West|Theta|01/12/2013|23000
] (delimiter is '|');

Concat1:
LOAD SalesGroup,MinString(Team) as MinString1 Resident TeamData Group By SalesGroup;

SalesGroup

East

West

MinString1

Alpha

Epsilon

При условии, что таблица TeamData загружается как в предыдущем примере, а текущий скрипт загрузки имеет оператор SET statement:
SET DateFormat='DD/MM/YYYY';':
LOAD SalesGroup,MinString(Date) as MinString2 Resident TeamData Group By SalesGroup;

SalesGroup

East

West

MinString2

01/05/2013

01062/2013

MinString — функция диаграммы

Функция MinString() находит строковые значения в выражении или поле и возвращает первое текстовое значение в порядке сортировки текста.

Синтаксис:
MinString({[SetExpression] [TOTAL [<fld {, fld}>]]} expr)

Тип возвращаемого значения: dual

Аргументы:

Аргумент Описание
expr Выражение или поле, содержащее данные для измерения.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен набором выражений анализа.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

После префикса TOTAL может быть указан список, включающий одно или несколько имен полей в угловых скобках <fld>. Эти имена полей должны быть поднабором переменных измерений диаграммы.

См.: Определение объема агрегирования

Примеры и результаты:
SalesGroup Amount MinString(Team) MinString(Date)
East 14000 Delta 2013/08/01
East 20000 Beta 2013/05/01
East 25000 Alpha 2013/07/01
West 14000 Eta 2013/10/01
West 17000 Epsilon 2013/09/01
West 19000 Zeta 2013/06/01
West 23000 Theta 2013/12/01

Примеры Результаты
MinString(Team)

Существует три значения 20000 для измерения Amount: два измерения элемента Gamma (с различными датами), и одно элемента Beta. Таким образом, результатом меры MinString (Team) является элемент Beta, поскольку это первое значение в отсортированных строках.

MinString(Date) 2013/11/01 является самым ранним значением Date из трех, ассоциированных с измерением Amount. Так предполагается, что ваш скрипт имеет оператор SET SET DateFormat='YYYY-MM-DD';

Данные, используемые в примере:

TeamData:
LOAD * inline [
SalesGroup|Team|Date|Amount
East|Gamma|01/05/2013|20000
East|Gamma|02/05/2013|20000
West|Zeta|01/06/2013|19000
East|Alpha|01/07/2013|25000
East|Delta|01/08/2013|14000
West|Epsilon|01/09/2013|17000
West|Eta|01/10/2013|14000
East|Beta|01/11/2013|20000
West|Theta|01/12/2013|23000
] (delimiter is '|');

Функции синтетических измерений

Синтетическое измерение создано в документе из значений, созданных из функций синтетического измерения, а не напрямую из полей в модели данных. Если значения, созданные функцией синтетического измерения, используются в диаграмме как вычисляемые измерения, создается синтетическое измерение. Синтетические измерения позволяют создавать, например, диаграммы с измерениями со значениями, происходящими от ваших данных, т. е. динамические измерения.

Выборки не влияют на синтетические измерения.

Следующие функции синтетических измерений можно использовать в диаграммах.

Пользуйтесь информацией из раскрывающегося списка по каждой функции, чтобы увидеть краткое описание и синтаксис каждой функции. Дополнительную информацию можно получить, если щелкнуть имя функции в описании синтаксиса.

ValueList

Функция ValueList() возвращает набор перечисленных значений, в результате чего при использовании в вычисляемом измерении образуется синтетическое измерение.

valuelist (v1 {, Expression})

ValueLoop

Функция ValueLoop() возвращает набор повторяемых значений, в результате чего при использовании в вычисляемом измерении образуется синтетическое измерение.

valueloop(from [, to [, step ]])

ValueList — функция диаграммы

Функция ValueList() возвращает набор перечисленных значений, в результате чего при использовании в вычисляемом измерении образуется синтетическое измерение.

В диаграммах с синтетическим измерением, созданным с помощью функции ValueList, можно указать ссылку на значение измерения, соответствующее определенной ячейке выражения. Для этого необходимо повторно запустить функцию ValueList с теми же параметрами в выражении диаграммы. Разумеется, функцию можно использовать в любом месте на макете, но, помимо использования для синтетических измерений, эта функция будет иметь смысл только внутри функции агрегирования.

Выборки не влияют на синтетические измерения.

Синтаксис:
ValueList(v1 {,...})

Тип возвращаемого значения: dual

Аргументы:

Аргумент Описание
v1 Статическое значение (обычно выраженное строкой, но возможно и числом).
{,…} Дополнительный список статических значений.

Примеры и результаты:
Пример Результат
ValueList('Number of Orders', 'Average Order Size', 'Total Amount')

При использовании для создания измерения в таблице, например, появляются три значения в строках в виде меток строк в таблице. В выражении на них может быть дана ссылка.

=IF( ValueList('Number of Orders', 'Average Order Size', 'Total Amount') = 'Number of Orders',count(SaleID),
IF( ValueList('Number of Orders', 'Average Order Size', 'Total Amount') = 'Average Order Size', avg(Amount), sum(Amount)))

Это выражение берет значения из созданного измерения и дает на них ссылку во вложенном операторе IF, как значения, вводимые в три функции агрегирования:

Created dimension Year Added expression
522.00
Number of Orders 2012 5.00
Number of Orders 2013 7.00
Average Order Size 2012 13.20
Average Order Size 2013 15.43
Total Amount 2012 66.00
Total Amount 2013 108.00

Данные, используемые в примерах:
SalesPeople:
LOAD * INLINE [
SaleID|SalesPerson|Amount|Year
1|1|12|2013
2|1|23|2013
3|1|17|2013
4|2|9|2013
5|2|14|2013
6|2|29|2013
7|2|4|2013
8|1|15|2012
9|1|16|2012
10|2|11|2012
11|2|17|2012
12|2|7|2012
] (delimiter is '|');

ValueLoop — функция диаграммы

Функция ValueLoop() возвращает набор повторяемых значений, в результате чего при использовании в вычисляемом измерении образуется синтетическое измерение.

Диапазон генерированных значений ограничивается значениями from и to, включая промежуточные значения в приращениях шага.

В диаграммах с синтетическим измерением, созданным с помощью функции ValueLoop, можно указать ссылку на значение измерения, соответствующее определенной ячейке выражения. Для этого необходимо повторно запустить функцию ValueLoop с теми же параметрами в выражении диаграммы. Разумеется, функцию можно использовать в любом месте на макете, но, помимо использования для синтетических измерений, эта функция будет иметь смысл только внутри функции агрегирования.

Выборки не влияют на синтетические измерения.

Синтаксис:
ValueLoop(from [, to [, step ]])

Тип возвращаемого значения: dual

Аргументы:

Аргументы Описание
from Необходимо создать начальное значение из ряда значений.
to Необходимо создать конечное значение из ряда значений.
step Размер приращения между значениями.

Примеры и результаты:
Пример Результат
ValueLoop(1, 10)

Создается измерение в таблице, например, такое, которое может быть использовано для обеспечения меток с числами. В этом примере в результате образованы значения от 1 до 10. В выражении на эти значения может быть дана ссылка.

ValueLoop(2, 10,2)

В этом примере в результате образованы значения 2, 4, 6, 8, и 10, поскольку аргумент step имеет значение 2.

Вложенные агрегирования

Возможны ситуации, когда необходимо применить агрегирование к результату другого агрегирования. Это называется вложенными агрегированиями.

По общему правилу использование вложенных агрегирований в выражениях диаграмм программы QlikView (и Qlik Sense) не допускается. Вложение допускается только в следующих случаях:

  • При использовании префикса TOTAL во внутренней функции агрегирования.

Допустимо не более 100 уровней вложения.

Вложенные агрегирования с префиксом TOTAL

Пример:

Например, необходимо вычислить сумму поля Sales, но должны быть включены только транзакции с элементом OrderDate, равным последнему году. Последний год может быть получен через функцию агрегирования Max(TOTAL Year(OrderDate)).

В результате следующего агрегирования будет получен желаемый результат.

Sum(If(Year(OrderDate)=Max(TOTAL Year(OrderDate)), Sales))

Включение префикса TOTAL абсолютно необходимо для этого типа вложенности, допустимого программой QlikView (и Qlik Sense), но при этом необходимо для сравнения. Этот тип вложенности часто требуется и должен использоваться во всех подходящих случаях.

Вложенные агрегирования с функцией агрегирования

Вложенности с префиксом TOTAL не всегда достаточно. Для более общей вложенности необходимо использовать функцию расширенного агрегирования данных вместе с вычисляемыми размерами.

Пример:

Следующие данные прочитаны из скрипта:

SalesRep Customer
Donna Brown Bechtel Corporation
Karl Anderson Berkeley Design
Donna Brown Capitolnet Marketing Group (CMG)
Karl Anderson Chas T.Main, Inc.
Karl Anderson Degoyler and MacNaughton
Lisa Taylor ediSys
John Smith Fimetrics System
Kathy johnson HCS
Lisa Taylor Homestead Custom
Lisa Taylor illuminati
John Smith Metro-Goldwyn-Mayer, Inc.
Lisa Taylor Onetouch Interactive
Peggie Hurt Savetz Publishing
William Fisher Tecc
William Fisher VA Research
Lisa Taylor XYZ Operations

На основе этих данных возникает очевидный вопрос: «Сколько клиентов у каждого торгового агента?».

На этот вопрос легко ответить, используя стандартную таблицу QlikView (и Qlik Sense):

На основе полученных данных могут появиться новые вопросы: "How may sales representatives have only a single customer? У скольких трое и более клиентов?.

Если не учитывать тот факт, что в этом простом случае можно сосчитать числа в столбцах выражения вручную, для этих типов вопросов требуется агрегирование второго порядка. Необходимые для вычислений данные отсутствуют в исходных полях, и их нельзя вычислить напрямую на основе полей.

Необходимо просто найти способ использовать столбец выражения в приведенной выше диаграмме в качестве измерения новой диаграммы. Это можно получить с помощью функции расширенного агрегирования.

Чтобы выполнить вычисления по первой диаграмме в качестве вычисления внутренней диаграммы в новой диаграмме, необходимо использовать следующий оператор для измерения:

=Aggr(Count(Customer),SalesRep)

А затем необходимо ввести следующее выражение для новой диаграммы:

Count(Distinct SalesRep)

Префикс DISTINCT необходим, поскольку приложение QlikView (и Qlik Sense) будет считать число строк в таблице ниже.

В получившейся в результате таблице находится ответ на вопрос «Сколько торговых агентов имеют 1, 2, 3 и более клиентов?»:

Необходимо отметить две вещи:

  1. Для второй диаграммы не требуется первая диаграмма. Она полностью самодостаточна с агрегированием первого порядка, определенным в пределах измерения.
  2. Возможности вложенности этим не ограничиваются. Аргументы измерения функции расширенного агрегирования могут, конечно, содержать определенные вычисляемые измерения, в свою очередь использующие функцию расширенного агрегирования. Однако при передаче третьего уровня агрегирования довольно просто запутаться.

Сумма строк в сводных таблицах

В приложении QlikView (и Qlik Sense) можно выбрать итоги прямой таблицы: простую сумму строк и вычисляемые итоги по выражению. В сводной таблице в приложении QlikView (и Qlik Sense) это выбрать нельзя. Итоги сводной таблицы всегда вычисляются как итоги по выражению.

Обычно этот вариант удовлетворителен, поскольку редко бывают случаи, когда итог суммы строк действителен при различии двух.

Следует крайне осторожно использовать суммы строк агрегирования типов, отличных от чистых сумм.

Отметив эту проблему, теперь рассмотрим пример, где итог суммы строк, тем не менее, является верным результатом.

Пример:

В школьном конкурсе участвуют три команды учащихся, которые набирают очки за отметки по трем предметам. Команда может выбрать самую высокую отметку в группе по отдельному предмету, а затем сложить три лучших отметки для получения итога. Следующие данные прочитаны из скрипта:

Class Name Score
English John 5
English Karen 1
English Lisa 4
History John 3
History Karen 3
History Lisa 2
Math John 3
Math Karen 3
Math Lisa 4

В прямой таблице с элементом Class в качестве измерения и Max(Score) в качестве выражения получается следующая сумма строк:

Class Max(Score)
English 5
History 3
Math 4
12

Если прямая таблица была преобразована в сводную таблицу, которая всегда вычисляется как итоговое выражение вместо суммы строк, возникнет вопрос:

Class Max(Score)
English 5
History 3
Math 4
Total 5

В данном случае итог 12 — это то, что ожидается, а 5 не походит для наших целей. В данном случае функцияAggr может быть использована в выражении, а не в измерении.

Исходное выражение заключено в функцию Aggr с использованием измерения окружающей диаграммы также в качестве измерения в функции Aggr. Теперь этот пакет используется в качестве аргумента для агрегирования Sum. Теперь в таблице отобразится ожидаемое итоговое значение:

Class sum(aggr(max(Score),Class))
English 5
History 3
Math 4
Total 12

Уникальность функции расширенного агрегирования состоит в том, что для отдельных строк оцениваются только отдельные значения. Очевидно, это обусловлено тем, что измерение имеет только одно возможное значение в каждой строке данных. Поскольку внутренние измерение и выражение такие же, как и для окружающей диаграммы, каждое значение будет таким же, как результат без заключения в элемент Sum и в функции расширенного агрегирования.

Однако для итога строк функция расширенного агрегирования возвратит три значения, каждое из которых соответствует полю измерения. Они в свою очередь суммируются агрегированием Sum. Хотя формально результат все еще является итогом по выражению, он соответствует сумме строк.

Линейная регрессия в диаграммах таблиц

Линии тренда линейной регрессии можно отобразить в растровых диаграммах программы QlikView (и Qlik Sense) с помощью параметра Линии тренда на странице Выражения в диалоге Свойства диаграммы. Также можно отобразить уравнение регрессии.

Пример:

Для отображения данных регрессии, например в диаграмме таблицы, необходимо вычислить регрессию. Функции агрегирования LINEST_M и LINEST_B предоставят необходимые значения наклона и точки пересечения с осью Y линейной регрессии. Функции агрегирования LINEST_M и LINEST_B всегда соответствуют непрерывной оси x, поэтому необходимо выбрать этот параметр на вкладке Оси свойств диаграммы.

Для правильного вычисления этим функциям необходимо предоставить все агрегирование диаграммы (выражение с итерацией для измерения) в качестве ввода. Чтобы сделать это, можно определить функцию расширенного агрегирования, содержащую то же базовое выражение и измерения, что и в содержащейся диаграмме. Затем функция расширенного агрегирования используется как параметры для агрегирований LINEST. Полученное выражение может выглядеть следующим образом:

linest_M(total aggr(TransVal,TransID),TransID)*TransID + linest_b(total aggr(TransVal,TransID),TransID)

Функция Only применяется для всех вхождений TransVal и TransID. Агрегирования LINEST должны иметь префикс TOTAL, в противном случае параметры регрессии будут вычислены для точек диаграмм, а не всего набора данных. Результат показан в комбо диаграмме ниже, в которой регрессия показана как регулярное линейное выражение.

Обратите внимание, что в данном случае линия тренда является не обычной линией тренда QlikView (и Qlik Sense), а регулярным выражением, отображенным как линия. Можно заметить различие, что график выражения, в отличие от обычной линии тренда, не экстраполирован вне первой и последней точек диаграммы.

Вычисленные значения линейных регрессий соответствуют значениям, отображаемым на графике с непрерывной осью (рекомендованный способ отображения). Вычисленные значения линейных регрессий могут отличаться от значений, отображаемых на графике с дискретной осью (не рекомендованный способ отображения). Непрерывная ось представляет вычисленные значения; дискретная ось представляет отображаемые значения. Это означает, что значения NULL не включаются в дискретную ось.

Эту диаграмму можно преобразовать в прямую таблицу:

Используются следующие выражения, приведенные в порядке отображения:

Round(Sum(TransVal),'0.1')
Round(LINEST_M(TransVal,TransID,TransID),'0,1')
Round(LINEST_B(TransVal,TransID,TransID),'0,1')

Подписка

RSS-материал