Cómo calcular la suma de cuadrados por error (sse)

La suma de errores cuadrados, o SSE, es un cálculo estadístico preliminar que conduce a otros valores de datos. Cuando tiene un conjunto de valores de datos, es útil poder encontrar lo estrechamente relacionados con esos valores. Debe organizar sus datos organizados en una tabla y luego realizar algunos cálculos bastante simples. Una vez que encuentre el SSE para un conjunto de datos, puede continuar para encontrar la varianza y la desviación estándar.

Pasos

Método 1 de 3:
Cálculo de SSE a mano
  1. Imagen titulada Calcule la suma de cuadrados para el error (SSE) Paso 1
1. Crear una tabla de tres columnas. La forma más clara de calcular la suma de errores cuadrados se inicia con una tabla de tres columnas. Etiquete las tres columnas como Valor{ DisplayStyle { Text {Value}}}{ texto {valor}}, Desviación{ DisplayStyle { Text {desviación}}}{ texto {desviación}}, y Desviación2{ mostrarstyle { texto {desviación}} ^ {2}}{ texto {desviación}} ^ {2}.
  • Imagen titulada Calcule la suma de cuadrados para el error (SSE) Paso 2
    2. Rellene los datos. La primera columna mantendrá los valores de sus medidas. Rellenar el Valor{ DisplayStyle { Text {Value}}}{ texto {valor}} Columna con los valores de sus mediciones. Estos pueden ser los resultados de algún experimento, un estudio estadístico o solo datos proporcionados para un problema de matemáticas.
  • En este caso, suponga que está trabajando con algunos datos médicos y usted tiene una lista de las temperaturas del cuerpo de diez pacientes. La temperatura corporal normal esperada es 98.6 grados. Las temperaturas de diez pacientes se miden y dan los valores 99.0, 98.6, 98.5, 101.1, 98.3, 98.6, 97.9, 98.4, 99.2, y 99.1. Escribe estos valores en la primera columna.
  • Imagen titulada Calcule la suma de los cuadrados para el error (SSE) Paso 3
    3. Calcular la media. Antes de que pueda calcular el error para cada medición, debe calcular la media del conjunto de datos completo.
  • Recuerde que la media de cualquier conjunto de datos es la suma de los valores, dividida por el número de valores en el conjunto. Esto se puede representar simbólicamente, con la variable μ{ mostrarstyle mu} mu Representando la media, como:
  • μ=ΣXnorte{ mostrarstyle mu = { frac { sigma x} {n}}} mu = { frac { sigma x} {n}}
  • Para estos datos, la media se calcula como:
  • μ=99.0+98.6+98.5+101.1+98.3+98.6+97.9+98.4+99.2+99.110{ mostrarstyle mu = { frac {99.0 + 98.6 + 98.5 + 101.1 + 98.3 + 98.6 + 97.9 + 98.4 + 99.2 + 99.1} {10}}} mu = { frac {99.0 + 98.6 + 98.5 + 101.1 + 98.3 + 98.6 + 97.9 + 98.4 + 99.2 + 99.1} {10}}
  • μ=988.710{ mostrarstyle mu = { frac {988.7} {10}}} mu = { frac {988.7} {10}}
  • μ=98.87{ mostrarstyle mu = 98.87} mu = 98.87
  • Imagen titulada Calcule la suma de cuadrados para el error (SSE) Paso 4
    4. Calcular las medidas de error individuales. En la segunda columna de su tabla, debe completar las mediciones de error para cada valor de datos. El error es la diferencia entre la medición y la media.
  • Para el conjunto de datos dado, reste la media, 98.87, de cada valor medido, y complete la segunda columna con los resultados. Estos diez cálculos son los siguientes:
  • 99.0-98.87=0.13{ DisplayStyle 99.0-98.87 = 0.13}99.0-98.87 = 0.13
  • 98.6-98.87=-0.27{ mostrarstyle 98.6-98.87 = -0.27}98.6-98.87 = -0.27
  • 98.5-98.87=-0.37{ mostrarstyle 98.5-98.87 = -0.37}98.5-98.87 = -0.37
  • 101.1-98.87=2.23{ DisplayStyle 101.1-98.87 = 2.23}101.1-98.87 = 2.23
  • 98.3-98.87=-0.57{ mostrarstyle 98.3-98.87 = -0.57}98.3-98.87 = -0.57
  • 98.6-98.87=-0.27{ mostrarstyle 98.6-98.87 = -0.27}98.6-98.87 = -0.27
  • 97.9-98.87=-0.97{ mostrarstyle 97.9-98.87 = -0.97}97.9-98.87 = -0.97
  • 98.4-98.87=-0.47{ mostrarstyle 98.4-98.87 = -0.47}98.4-98.87 = -0.47
  • 99.2-98.87=0.33{ DisplayStyle 99.2-98.87 = 0.33}99.2-98.87 = 0.33
  • 99.1-98.87=0.23{ DisplayStyle 99.1-98.87 = 0.23}99.1-98.87 = 0.23
  • Imagen titulada Calcule la suma de cuadrados para el error (SSE) Paso 5
    5. Calcular los cuadrados de los errores. En la tercera columna de la tabla, encuentre el cuadrado de cada uno de los valores resultantes en la columna central. Estos representan los cuadrados de la desviación de la media para cada valor medido de los datos.
  • Para cada valor en la columna central, use su calculadora y encuentre el cuadrado. Registre los resultados en la tercera columna, de la siguiente manera:
  • 0.132=0.0169{ mostrarstyle 0.13 ^ {2} = 0.0169}0.13 ^ {2} = 0.0169
  • (-0.27)2=0.0729{ DisplayStyle (-0.27) ^ {2} = 0.0729}(-0.27) ^ {2} = 0.0729
  • (-0.37)2=0.1369{ DisplayStyle (-0.37) ^ {2} = 0.1369}(-0.37) ^ {2} = 0.1369
  • 2.232=4.9729{ mostrarstyle 2.23 ^ {2} = 4.9729}2.23 ^ {2} = 4.9729
  • (-0.57)2=0.3249{ DisplayStyle (-0.57) ^ {2} = 0.3249}(-0.57) ^ {2} = 0.3249
  • (-0.27)2=0.0729{ DisplayStyle (-0.27) ^ {2} = 0.0729}(-0.27) ^ {2} = 0.0729
  • (-0.97)2=0.9409{ DisplayStyle (-0.97) ^ {2} = 0.9409}(-0.97) ^ {2} = 0.9409
  • (-0.47)2=0.2209{ DisplayStyle (-0.47) ^ {2} = 0.2209}(-0.47) ^ {2} = 0.2209
  • 0.332=0.1089{ mostrarstyle 0.33 ^ {2} = 0.1089}0.33 ^ {2} = 0.1089
  • 0.232=0.0529{ mostrarstyle 0.23 ^ {2} = 0.0529}0.23 ^ {2} = 0.0529
  • Imagen titulada Calcule la suma de los cuadrados para el error (SSE) Paso 6
    6. Añadir los cuadrados de errores juntos. El paso final es encontrar la suma de los valores en la tercera columna. El resultado deseado es el SSE, o la suma de errores cuadrados.
  • Para este conjunto de datos, el SSE se calcula agregando juntos los diez valores en la tercera columna:
  • SSmi=6.921{ DisplayStyle SSE = 6.921}SSE = 6.921
  • Método 2 de 3:
    Creando una hoja de cálculo de Excel para calcular SSE
    1. Imagen titulada Calcule la suma de los cuadrados para el error (SSE) Paso 7
    1. Etiqueta las columnas de la hoja de cálculo. Crearás una tabla de tres columnas en Excel, con los mismos tres encabezados que arriba.
    • En la celda A1, escriba en el encabezado "Valor."
    • En la celda B1, ingrese la desviación "."
    • En la celda C1, ingrese el encabezado "Deviation Squared."
  • Imagen titulada Calcule la suma de cuadrados para el error (SSE) Paso 8
    2. Ingrese sus datos. En la primera columna, debe escribir los valores de sus mediciones. Si el conjunto es pequeño, simplemente puede escribirlos a mano. Si tiene un conjunto de datos grandes, es posible que deba copiar y pegar los datos en la columna.
  • Imagen titulada Calcule la suma de cuadrados para el error (SSE) Paso 9
    3. Encuentra la media de los puntos de datos. Excel tiene una función que calculará la media para usted. En alguna célula vacía debajo de su tabla de datos (realmente no importa qué celda elija), ingrese lo siguiente:
  • = Promedio (A2: ___)
  • En realidad no escriba un espacio en blanco. Rellene ese espacio en blanco con el nombre de la celda de su último punto de datos. Por ejemplo, si tiene 100 puntos de datos, utilizará la función:
  • = Promedio (A2: A101)
  • Esta función incluye datos de A2 a A101 porque la fila superior contiene los encabezados de las columnas.
  • Cuando presiona ENTER o cuando hace clic en cualquier otra celda de la tabla, la media de los valores de datos llenará automáticamente la celda que acaba de programar.
  • Imagen titulada Calcule la suma de cuadrados para el error (SSE) Paso 10
    4. Ingrese la función para las mediciones de error. En la primera celda vacía en la columna "Desviación", debe ingresar una función para calcular la diferencia entre cada punto de datos y la media. Para hacer esto, debe usar el nombre de la celda donde reside la media. Asumamos por ahora que usaste la celda A104.
  • La función para el cálculo de errores, que ingresa en la celda B2, será:
  • = A2- $ A $ 104.Los signos de dólar son necesarios para asegurarse de que se bloquee en la celda A104 para cada cálculo.
  • Imagen titulada Calcule la suma de los cuadrados para el error (SSE) Paso 11
    5. Ingrese la función para los cuadrados de error. En la tercera columna, puede dirigir Excel para calcular el cuadrado que necesita.
  • En la celda C2, ingrese la función
  • = B2 ^ 2
  • Imagen titulada Calcule la suma de cuadrados para el error (SSE) Paso 12
    6. Copia las funciones para llenar toda la tabla. Después de ingresar las funciones en la celda superior de cada columna, B2 y C2, respectivamente, debe completar la tabla completa. Podrías volver a escribir la función en cada línea de la tabla, pero esto se llevaría demasiado tiempo. Use su mouse, resalte las celdas B2 y C2, y sin dejar ir al botón del mouse, arrastre hacia abajo hasta la celda inferior de cada columna.
  • Si asumimos que tiene 100 puntos de datos en su tabla, arrastrará el mouse hasta celdas B101 y C101.
  • Cuando luego suelte el botón del mouse, las fórmulas se copiarán en todas las celdas de la tabla. La tabla debe ser poblada automáticamente con los valores calculados.
  • Imagen titulada Calcule la suma de cuadrados para el error (SSE) Paso 13
    7. Encontrar el SSE. La columna C de su tabla contiene todos los valores de error cuadrado. El paso final es tener Excel calcular la suma de estos valores.
  • En una celda debajo de la tabla, probablemente C102 para este ejemplo, ingrese la función:
  • = Suma (C2: C101)
  • Cuando hace clic en Enter o haga clic en cualquier otra celda de la tabla, debe tener el valor de SSE para sus datos.
  • Método 3 de 3:
    Relacionando SSE a otros datos estadísticos
    1. Imagen titulada Calcule la suma de cuadrados para Error (SSE) Paso 14
    1. Calcular la varianza de SSE. Encontrar el SSE para un conjunto de datos es generalmente un bloque de construcción para encontrar otros valores más útiles. El primero de estos es la varianza. La varianza es una medición que indica cuánto varía los datos medidos de la media. En realidad, es el promedio de las diferencias cuadradas de la media.
    • Debido a que el SSE es la suma de los errores cuadrados, puede encontrar el promedio (que es la varianza), simplemente dividiendo por el número de valores. Sin embargo, si está calculando la varianza de un conjunto de muestras, en lugar de una población completa, se dividirá por (N-1) en lugar de n. Por lo tanto:
    • Varineros = sse / n, si está calculando la varianza de una población completa.
    • Variunde = sse / (n-1), si está calculando la varianza de un conjunto de datos de muestra.
  • Para el problema de la muestra de las temperaturas de los pacientes, podemos asumir que 10 pacientes representan solo un conjunto de muestras. Por lo tanto, la varianza se calculará como:
  • Diferencia=Sse(norte-1){ DisplayStyle { Text {Variance}} = { frac { texto {sse}} {(n-1)}}}{ texto {variiance}} = { frac {{ texto {sse}}} {(n-1)}}
  • Diferencia=6.9219{ DisplayStyle { Text {Variance}} = { frac {6.921} {9}}}{ texto {variiance}} = { frac {6.921} {9}}
  • Diferencia=0.769{ DisplayStyle { Text {Variance}} = 0.769}{ texto {variiance}} = 0.769
  • Imagen titulada Calcule la suma de cuadrados para el error (SSE) Paso 15
    2. Calcular la desviación estándar de SSE. La desviación estándar es un valor común que indica cuánto se desvían los valores de cualquier conjunto de datos de la media. La desviación estándar es la raíz cuadrada de la varianza. Recuerde que la varianza es el promedio de las mediciones de error cuadradas.
  • Por lo tanto, después de que calcule el SSE, puede encontrar la desviación estándar de la siguiente manera:
  • Desviación Estándar=Ssenorte-1{ mostrarstyle { texto {desviación estándar}} = { sqrt { frac { texto {sse}} {n-1}}}}{ texto {desviación estándar}} = { sqrt {{ frac {{ texto {sse}}} {n-1}}}}}
  • Para la muestra de datos de las mediciones de temperatura, puede encontrar la desviación estándar de la siguiente manera:
  • Desviación Estándar=Ssenorte-1{ mostrarstyle { texto {desviación estándar}} = { sqrt { frac { texto {sse}} {n-1}}}}{ texto {desviación estándar}} = { sqrt {{ frac {{ texto {sse}}} {n-1}}}}}
  • Desviación Estándar=6.9219{ mostrarstyle { texto {desviación estándar}} = { sqrt { frac { texto {6.921}} {9}}}}{ texto {desviación estándar}} = { sqrt {{ frac {{ texto {6.921}}} {9}}}}
  • Desviación Estándar=.769{ mostrarstyle { texto {desviación estándar}} = { sqrt {.769}}}{ texto {desviación estándar}} = { sqrt {.769}}
  • Desviación Estándar=0.877{ mostrarstyle { texto {desviación estándar}} = 0.877}{ texto {desviación estándar}} = 0.877
  • Imagen titulada Calcule la suma de cuadrados para el error (SSE) Paso 16
    3. Usa SSE para medir la covarianza. Este artículo se ha centrado en los conjuntos de datos que miden solo un solo valor a la vez. Sin embargo, en muchos estudios, puede estar comparando dos valores separados. Querría saber cómo se relacionan los dos valores entre sí, no solo a la media del conjunto de datos. Este valor es la covarianza.
  • Los cálculos para la covarianza están demasiado involucrados para los detalles aquí, excepto para tener en cuenta que utilizará el SSE para cada tipo de datos y luego los comparará. Para una descripción más detallada de la covarianza y los cálculos involucrados, vea Calcular la covarianza.
  • Como ejemplo del uso de la covarianza, es posible que desee comparar las edades de los pacientes en un estudio médico a la efectividad de un medicamento para reducir las temperaturas de la fiebre. Luego tendría un conjunto de datos de edades y un segundo conjunto de datos de temperaturas. Encontraría el SSE para cada conjunto de datos, y luego desde allí encontrar la varianza, las desviaciones estándar y la covarianza.
  • Consejos

    Artículos Relacionados