Media móvil Este ejemplo le enseña cómo calcular el promedio móvil de una serie de tiempo en Excel. Una gran ventaja se utiliza para suavizar las irregularidades (picos y valles) para reconocer fácilmente las tendencias. 1. En primer lugar, echemos un vistazo a nuestra serie de tiempo. 2. En la ficha Datos, haga clic en Análisis de datos. Nota: no puede encontrar el botón Análisis de datos Haga clic aquí para cargar el complemento Herramientas de análisis. 3. Seleccione Media móvil y haga clic en Aceptar. 4. Haga clic en el cuadro Rango de entrada y seleccione el rango B2: M2. 5. Haga clic en el cuadro Interval y escriba 6. 6. Haga clic en el cuadro Rango de salida y seleccione la celda B3. 8. Trazar un gráfico de estos valores. Explicación: dado que establecemos el intervalo en 6, el promedio móvil es el promedio de los 5 puntos de datos anteriores y el punto de datos actual. Como resultado, los picos y valles se suavizan. El gráfico muestra una tendencia creciente. Excel no puede calcular la media móvil para los primeros 5 puntos de datos porque no hay suficientes puntos de datos anteriores. 9. Repita los pasos 2 a 8 para el intervalo 2 y el intervalo 4. Conclusión: Cuanto mayor sea el intervalo, más se suavizarán los picos y los valles. Cuanto más pequeño es el intervalo, más cerca están las medias móviles de los puntos de datos reales. Cómo calcular las puntuaciones Z La puntuación AZ le permite tomar cualquier muestra dada dentro de un conjunto de datos y determinar cuántas desviaciones estándar por encima o por debajo de la media es . 1. Para encontrar la puntuación Z de una muestra, necesitará encontrar la media, la varianza y la desviación estándar de la muestra. Para calcular la puntuación z, encontrará la diferencia entre un valor en la muestra y la media, y divídelo por la desviación estándar. Aunque hay muchos pasos a este método de principio a fin, es un cálculo bastante simple. Pasos Editar Parte Uno de Cuatro: Cálculo de la Media Edición Mire su conjunto de datos. Necesitará ciertas piezas clave de información para calcular el promedio o el promedio matemático de su muestra. 2 Saber cuántos números hay en su muestra. En el caso de la muestra de palmeras, hay 5 en esta muestra. Sepa lo que representan los números. En nuestro ejemplo, estos números representan mediciones de árboles. Mire la variación en los números. ¿Los datos varían a través de un rango grande, o un rango pequeñoGather todos los datos. Necesitará todos los números de su muestra para comenzar sus cálculos. 3 La media es la media de todos los números de la muestra. Para calcular esto, agregará todos los números de su muestra, luego divida el tamaño de la muestra. En la notación matemática, n representa el tamaño de la muestra. En el caso de nuestra muestra de alturas de árbol, n 5 ya que hay 5 números en esta muestra. Agregue todos los números de su muestra juntos. Esta es la primera parte del cálculo de la media o media matemática. 4 Por ejemplo, utilizando la muestra de 5 palmeras, nuestra muestra consta de 7, 8, 8, 7,5 y 9. 7 8 8 7,5 9 39,5. Esta es la suma de todos los números de su muestra. Compruebe su respuesta para asegurarse de que hizo su adición correctamente. Divide la suma por el tamaño de la muestra (n). Esto proporcionará el promedio o la media de los datos. 5 Por ejemplo, utilice nuestra muestra de alturas de árbol: 7, 8, 8, 7.5 y 9. Hay 5 números en nuestra muestra para n 5. La suma de alturas de árbol en nuestra muestra fue de 39.5. A continuación, dividir esta cifra por 5 para calcular la media. 39,5 / 5 7,9. La altura media del árbol es de 7,9 pies. La media de la población es a menudo representada por el símbolo, por lo tanto 7.9 Parte dos de cuatro: Encontrar la variación Editar Encontrar la varianza. La varianza es una cifra que representa hasta qué punto los datos de su muestra se agrupan alrededor de la media. 6 Este cálculo le dará una idea de cuán lejos se extienden sus datos. Las muestras con baja varianza tienen datos que se agrupan estrechamente alrededor de la media. Las muestras con alta varianza tienen datos que se diseminan lejos de la media. La varianza se utiliza a menudo para comparar las distribuciones entre dos conjuntos de datos o muestras. Reste la media de cada uno de los números de su muestra. Esto le dará una idea de cuánto cada número en su muestra difiere de la media. 7 En nuestra muestra de alturas de árboles (7, 8, 8, 7,5 y 9 pies) la media fue de 7,9. 7 - 7,9 - 0,9, 8 - 7,9 0,1, 8 - 7,9 0,1, 7,5 - 7,9 - 0,4 y 9 - 7,9 1,1. Hacer estos cálculos de nuevo para revisar sus matemáticas. Es muy importante que tenga las cifras correctas para este paso. Cubre todas las respuestas de las sustracciones que acabas de hacer. Necesitará cada una de estas figuras para calcular la varianza de su muestra. 8 Recuerde que en nuestra muestra restamos la media de 7,9 de cada uno de nuestros puntos de datos (7, 8, 8, 7, 7 y 9) y obtuvimos lo siguiente: -0,9, 0,1, 0,1, -0,4 y 1,1. Cuadrado de todas estas cifras: (-0,9) 2 0,81, (0,1) 2 0,01, (0,1) 2 0,01, (-0,4) 2 0,16 y (1,1) 2 1,21. Los cuadrados de este cálculo son: 0,81, 0,01, 0,01, 0,16 y 1,21. Revise sus respuestas antes de pasar al siguiente paso. Agregue los números al cuadrado juntos. Este cálculo se llama la suma de cuadrados. 9 En nuestra muestra de alturas de árboles, los cuadrados fueron los siguientes: 0,81, 0,01, 0,01, 0,16 y 1,21. 0,81 0,01 0,01 0,16 1,21 2,2 Para nuestro ejemplo de alturas de árbol, la suma de cuadrados es 2,2. Compruebe su adición para asegurarse de que tiene la figura correcta antes de seguir adelante. Divide la suma de cuadrados por (n-1). Recuerde, n es el tamaño de la muestra (cuántos números hay en su muestra). Hacer este paso proporcionará la varianza. 10 En nuestra muestra de alturas de árboles (7, 8, 8, 7,5 y 9 pies), la suma de cuadrados fue 2,2. Hay 5 números en esta muestra. Por lo tanto n 5. n - 1 4 Recuerde que la suma de cuadrados es 2.2. Para calcular la varianza, calcule lo siguiente: 2.2 / 4. 2.2 / 4 0.55 Por lo tanto, la varianza para esta muestra de alturas de árbol es 0.55. Encuentre su figura de la varianza. Necesitará esto para encontrar la desviación estándar de su muestra. 11 La diferencia es cómo se extienden sus datos es de la media o el promedio matemático. La desviación estándar es una cifra que representa cómo se extienden sus datos en su muestra. En nuestra muestra de alturas de árboles, la varianza fue de 0,55. Tome la raíz cuadrada de la varianza. Esta cifra es la desviación estándar. 12 En nuestra muestra de alturas de árboles, la varianza fue de 0,55. 0,55 0,741619848709566. A menudo se obtiene una cifra decimal muy grande cuando se calcula este paso. Está bien redondear a la segunda o tercera cifra decimal para su cifra de desviación estándar. En este caso, puede utilizar 0.74. Usando una figura redondeada, la desviación estándar en nuestra muestra de alturas de árbol es 0.74 Vaya de nuevo encontrando la media, la varianza y la desviación estándar. Esto le permitirá asegurarse de que tiene la cifra correcta para la desviación estándar. Escriba todos los pasos que tomó cuando hizo sus cálculos. Esto le permitirá ver dónde cometió un error, si lo hubo. Si usted presenta diferentes cifras de media, varianza y desviación estándar durante su cheque, repita los cálculos mirando su proceso cuidadosamente. Cuarta parte de Cuatro: Cálculo de las puntuaciones Z Editar Utilice el siguiente formato para encontrar una puntuación z: z X - /. Esta fórmula le permite calcular una puntuación z para cualquier punto de datos de su muestra. 13 Recuerde, una puntuación z es una medida de cuántas desviaciones estándar un punto de datos está lejos de la media. En la fórmula X representa la figura que desea examinar. Por ejemplo, si desea averiguar cuántas desviaciones estándar 7.5 fue de la media en nuestro ejemplo de alturas de árboles, se debería conectar 7.5 para X en la ecuación. En la fórmula, significa la media. En nuestra muestra de alturas de árboles la media fue de 7,9. En la fórmula, representa la desviación estándar. En nuestra muestra de alturas de árboles la desviación estándar fue de 0.74. Inicie la fórmula restando la media del punto de datos que desea examinar. Esto comenzará los cálculos para una puntuación z. 14 Por ejemplo, en nuestra muestra de alturas de árbol queremos averiguar cuántas desviaciones estándar 7.5 es de la media de 7.9. Por lo tanto, realizaría lo siguiente: 7.5 - 7.9. 7,5 - 7,9 - 0,4. Compruebe que tiene la media correcta y la figura de sustracción antes de proceder. Divida la figura de sustracción que acaba de completar con la desviación estándar. Este cálculo le proporcionará su puntuación z. 15 En nuestra muestra de alturas de árbol, queremos la puntuación z para el punto de datos 7.5. Ya hemos substraído la media de 7,5, y se llegó con una cifra de -0,4. Recuerde, la desviación estándar de nuestra muestra de alturas de árboles fue 0.74. - 0,4 / 0,74 - 0,54 Por lo tanto, la puntuación z en este caso es -0,54. Esta puntuación z significa que 7.5 es -0.54 desviaciones estándar de distancia de la media en nuestra muestra de altura de los árboles. Las puntuaciones Z pueden ser tanto números positivos como negativos. Una puntuación z negativa indica que el punto de datos es menor que la media y un puntaje z positivo indica que el punto de datos en cuestión es mayor que la media. El DAX incluye algunas funciones de agregación estadística, tales como el promedio, la varianza y el estándar desviación. Otros cálculos estadísticos típicos requieren que se escriban expresiones DAX más largas. Excel, desde este punto de vista, tiene un lenguaje mucho más rico. Los patrones estadísticos son una colección de cálculos estadísticos comunes: mediana, modo, media móvil, percentil y cuartil. Queremos agradecer a Colin Banfield, Gerard Brueckl y Javier Guilln, cuyos blogs inspiraron algunos de los siguientes patrones. Ejemplo de patrón básico Las fórmulas de este patrón son las soluciones para cálculos estadísticos específicos. Promedio Puede utilizar las funciones estándar de DAX para calcular la media (promedio aritmético) de un conjunto de valores. PROMEDIO . Devuelve el promedio de todos los números en una columna numérica. AVERAGEA. Devuelve el promedio de todos los números de una columna, manejando texto y valores no numéricos (los valores de texto no numéricos y vacíos se cuentan como 0). AVERAGEX. Calcular el promedio de una expresión evaluada sobre una tabla. Promedio móvil El promedio móvil es un cálculo para analizar puntos de datos mediante la creación de una serie de promedios de diferentes subconjuntos del conjunto de datos completo. Puede utilizar muchas técnicas DAX para implementar este cálculo. La técnica más sencilla consiste en utilizar AVERAGEX, iterar una tabla de la granularidad deseada y calcular para cada iteración la expresión que genera el punto de datos único para utilizar en el promedio. Por ejemplo, la fórmula siguiente calcula el promedio móvil de los últimos 7 días, suponiendo que está utilizando una tabla de fechas en su modelo de datos. Utilizando AVERAGEX, calcula automáticamente la medida en cada nivel de granularidad. Cuando se utiliza una medida que puede agregarse (como SUM), entonces otro enfoque basado en CALCULATE puede ser más rápido. Puede encontrar este enfoque alternativo en el patrón completo de Promedio móvil. Variación Puede utilizar funciones DAX estándar para calcular la varianza de un conjunto de valores. VAR. S. Devuelve la varianza de valores en una columna que representa una población de muestra. VAR. P. Devuelve la varianza de valores en una columna que representa a toda la población. VARX. S. Devuelve la varianza de una expresión evaluada sobre una tabla que representa una población de muestra. VARX. P. Devuelve la varianza de una expresión evaluada sobre una tabla que representa a toda la población. Desviación estándar Puede utilizar las funciones DAX estándar para calcular la desviación estándar de un conjunto de valores. STDEV. S. Devuelve la desviación estándar de los valores en una columna que representa una población de muestra. STDEV. P. Devuelve la desviación estándar de los valores en una columna que representa a toda la población. STDEV. S. Devuelve la desviación estándar de una expresión evaluada sobre una tabla que representa una población de muestra. STDEV. P. Devuelve la desviación estándar de una expresión evaluada sobre una tabla que representa a toda la población. Mediana La mediana es el valor numérico que separa la mitad superior de una población de la mitad inferior. Si hay un número impar de filas, la mediana es el valor medio (clasificando las filas del valor más bajo al valor más alto). Si hay un número par de filas, es el promedio de los dos valores medios. La fórmula ignora los valores en blanco, que no se consideran parte de la población. El resultado es idéntico a la función MEDIAN en Excel. La figura 1 muestra una comparación entre el resultado devuelto por Excel y la fórmula DAX correspondiente para el cálculo mediano. Figura 1 Ejemplo de cálculo mediano en Excel y DAX. Modo El modo es el valor que aparece más a menudo en un conjunto de datos. La fórmula ignora los valores en blanco, que no se consideran parte de la población. El resultado es idéntico a las funciones MODE y MODE. SNGL en Excel, que devuelven sólo el valor mínimo cuando hay múltiples modos en el conjunto de valores considerados. La función MODE. MULT de Excel devolverá todos los modos, pero no puede implementarlo como una medida en DAX. La figura 2 compara el resultado devuelto por Excel con la fórmula DAX correspondiente para el cálculo de modo. Figura 2 Ejemplo de cálculo de modo en Excel y DAX. Percentil El percentil es el valor por debajo del cual cae un determinado porcentaje de valores en un grupo. La fórmula ignora los valores en blanco, que no se consideran parte de la población. El cálculo en DAX requiere varios pasos, descritos en la sección Patrón completo, que muestra cómo obtener los mismos resultados de las funciones de Excel PERCENTIL, PERCENTILE. INC y PERCENTILE. EXC. Cuartil Los cuartiles son tres puntos que dividen un conjunto de valores en cuatro grupos iguales, cada grupo que comprende un cuarto de los datos. Puede calcular los cuartiles usando el patrón de Percentile, siguiendo estas correspondencias: Primer cuartil cuartil inferior 25 percentil Segundo cuartil mediano 50 percentil Tercer cuartil cuartil superior 75 percentil completo Patrón completo Algunos cálculos estadísticos tienen una descripción más larga del patrón completo, porque Puede que tenga diferentes implementaciones dependiendo de los modelos de datos y otros requisitos. Promedio móvil Normalmente, se evalúa el promedio móvil haciendo referencia al nivel de granularidad del día. La plantilla general de la siguiente fórmula tiene estos marcadores: ltnumberofdaysgt es el número de días para el promedio móvil. Ltdatecolumngt es la columna de fecha de la tabla de fechas si la tiene o la columna de fecha de la tabla que contiene valores si no hay una tabla de fechas separada. Ltmeasuregt es la medida a calcular como media móvil. El patrón más sencillo utiliza la función AVERAGEX en DAX, que considera automáticamente sólo los días para los que existe un valor. Como alternativa, puede utilizar la siguiente plantilla en modelos de datos sin una tabla de fechas y con una medida que puede agregarse (como SUM) durante todo el período considerado. La fórmula anterior considera un día sin datos correspondientes como una medida que tiene valor 0. Esto sólo puede ocurrir cuando tiene una tabla de fechas por separado, que puede contener días para los que no hay transacciones correspondientes. Puede fijar el denominador para el promedio utilizando sólo el número de días para los que hay transacciones utilizando el siguiente patrón, donde: ltfacttablegt es la tabla relacionada con la tabla de fechas y que contiene los valores calculados por la medida. Puede utilizar las funciones DATESBETWEEN o DATESINPERIOD en lugar de FILTER, pero éstas funcionan sólo en una tabla de fechas normal, mientras que puede aplicar el patrón descrito anteriormente también a tablas de fechas no regulares ya modelos que no tienen una tabla de fechas. Por ejemplo, considere los diferentes resultados producidos por las dos medidas siguientes. En la Figura 3, puede ver que no hay ventas el 11 de septiembre de 2005. Sin embargo, esta fecha se incluye en la tabla de fechas por lo tanto, hay 7 días (del 11 de septiembre al 17 de septiembre) que tienen sólo 6 días con datos. Figura 3 Ejemplo de un cálculo del promedio móvil considerando e ignorando las fechas sin ventas. La medida Moving Average 7 Days tiene un número menor entre el 11 de septiembre y el 17 de septiembre, porque considera el 11 de septiembre como un día con 0 ventas. Si desea ignorar días sin ventas, utilice la medida Promedio móvil 7 días sin cero. Este podría ser el enfoque correcto cuando tiene una tabla de fechas completa, pero desea ignorar los días sin transacciones. Utilizando la fórmula Moving Average 7 Days, el resultado es correcto porque AVERAGEX considera automáticamente sólo los valores no en blanco. Tenga en cuenta que puede mejorar el rendimiento de un promedio móvil al persistir el valor en una columna calculada de una tabla con la granularidad deseada, como la fecha o la fecha y el producto. Sin embargo, el enfoque de cálculo dinámico con una medida ofrece la posibilidad de utilizar un parámetro para el número de días de la media móvil (por ejemplo, reemplazar ltnumberofdaysgt con una medida que implementa el patrón de la tabla de parámetros). Mediana La mediana corresponde al percentil 50, que se puede calcular con el patrón Percentile. Sin embargo, el patrón Median le permite optimizar y simplificar el cálculo mediano con una sola medida, en lugar de las varias medidas requeridas por el patrón Percentile. Puede utilizar este enfoque cuando calcule la mediana de los valores incluidos en ltvaluecolumngt, como se muestra a continuación: Para mejorar el rendimiento, es posible que desee persistir el valor de una medida en una columna calculada, si desea obtener la mediana de los resultados de Una medida en el modelo de datos. Sin embargo, antes de realizar esta optimización, debe implementar el cálculo MedianX basado en la siguiente plantilla, utilizando estos marcadores: ltgranularitytablegt es la tabla que define la granularidad del cálculo. Por ejemplo, puede ser la tabla de fechas si desea calcular la mediana de una medida calculada en el nivel de día o puede ser VALUES (8216DateYearMonth) si desea calcular la mediana de una medida calculada al nivel de mes. Ltmeasuregt es la medida a calcular para cada fila de ltgranularitytablet para el cálculo mediano. Ltmeasuretablegt es la tabla que contiene los datos utilizados por ltmeasuregt. Por ejemplo, si el ltgranularitytablegt es una dimensión como 8216Date8217, entonces el ltmeasuretablegt será 8216Internet Sales8217 que contiene la columna Internet Sales Amount sumada por la medida Total Sales de Internet. Por ejemplo, puede escribir la mediana de ventas totales de Internet para todos los clientes en Adventure Works de la siguiente manera: Sugerencia El siguiente patrón: se utiliza para eliminar filas de ltgranularitytablegt que no tienen datos correspondientes en la selección actual. Es una forma más rápida que usar la siguiente expresión: Sin embargo, puede reemplazar toda la expresión CALCULATETABLE con sólo ltgranularitytablegt si desea considerar valores en blanco de ltmeasuregt como 0. El rendimiento de la fórmula MedianX depende del número de filas en la Tabla repetida y sobre la complejidad de la medida. Si el rendimiento es malo, puede persistir el resultado de ltmeasuregt en una columna calculada del lttablegt, pero esto eliminará la capacidad de aplicar filtros al cálculo mediano en el momento de la consulta. Percentile Excel tiene dos implementaciones diferentes de cálculo de percentil con tres funciones: PERCENTIL, PERCENTILE. INC y PERCENTILE. EXC. Todos ellos devuelven el percentil K de valores, donde K está en el rango de 0 a 1. La diferencia es que PERCENTIL y PERCENTILE. INC consideran K como un rango inclusivo, mientras que PERCENTILE. EXC considera el rango K 0 a 1 como exclusivo . Todas estas funciones y sus implementaciones DAX reciben un valor per centile como parámetro, que llamamos valor de percentil K. ltKgt está en el rango de 0 a 1. Las dos implementaciones DAX de percentil requieren algunas medidas que son similares, pero lo suficientemente diferentes como para requerir Dos diferentes conjuntos de fórmulas. Las medidas definidas en cada patrón son: KPerc. El valor percentil corresponde a ltKgt. PercPos. La posición del percentil en el conjunto ordenado de valores. ValueLow. El valor por debajo de la posición percentil. Valor Alto. El valor por encima de la posición percentil. Percentil El cálculo final del percentil. Necesita las medidas ValueLow y ValueHigh en caso de que el PercPos contenga una parte decimal, ya que entonces tiene que interpolar entre ValueLow y ValueHigh para devolver el valor percentil correcto. La figura 4 muestra un ejemplo de los cálculos realizados con fórmulas Excel y DAX, utilizando ambos algoritmos de percentil (inclusive y exclusivos). Figura 4 Cálculos de percentil usando fórmulas de Excel y el cálculo DAX equivalente. En las siguientes secciones, las fórmulas Percentile ejecutan el cálculo en valores almacenados en una columna de tabla, DataValue, mientras que las fórmulas PercentileX ejecutan el cálculo en valores devueltos por una medida calculada en una granularidad dada. Percentile Inclusive La implementación de Percentile Inclusive es la siguiente. Percentile Exclusive La implementación de Percentile Exclusive es la siguiente. PercentileX Inclusive La implementación de PercentileX Inclusive se basa en la siguiente plantilla, utilizando estos marcadores: ltgranularitytablegt es la tabla que define la granularidad del cálculo. Por ejemplo, podría ser la tabla de fechas si desea calcular el percentil de una medida en el nivel de día o puede ser VALUES (8216DateYearMonth) si desea calcular el percentil de una medida en el nivel de mes. Ltmeasuregt es la medida a calcular para cada fila de ltgranularitytablet para el cálculo del percentil. Ltmeasuretablegt es la tabla que contiene los datos utilizados por ltmeasuregt. Por ejemplo, si el ltgranularitytablegt es una dimensión tal como 8216Date, 8217 entonces el ltmeasuretablegt será 8216Sales8217 que contiene la columna de la cantidad sumada por la medida de la cantidad total. Por ejemplo, puede escribir PercentileXInc del importe total de ventas para todas las fechas de la tabla de fechas de la siguiente manera: PercentileX Exclusive La implementación de PercentileX Exclusive se basa en la siguiente plantilla, utilizando los mismos marcadores utilizados en PercentileX Inclusive: Puede escribir el PercentileXExc del monto total de ventas para todas las fechas en la tabla de fechas de la siguiente manera: Descargas Manténgame informado sobre los próximos patrones (boletín). Desmarque para descargar libremente el archivo. El patrón de Análisis de Canas permite el análisis de las relaciones de co-ocurrencia entre transacciones relacionadas con una determinada entidad, tales como productos comprados en el mismo orden o por el mismo cliente en compras diferentes . Este patrón es una especialización de la Encuesta hellip Jerarquías Padre-Hijo DAX no soporta directamente jerarquías padre-hijo. Para obtener una jerarquía navegable en el modelo de datos, debe naturalizar una jerarquía padre-hijo. DAX proporciona funciones específicas para naturalizar una jerarquía padre-hijo usando columnas calculadas. El patrón completo también incluye hellip Dax Patterns es producido por SQLBI. Copyright copy Loader. Todos los derechos reservados. Microsoft Excel reg y todas las demás marcas comerciales y derechos de autor son propiedad de sus respectivos propietarios.
No comments:
Post a Comment