X b) R2 = r2 = 0'5711 Representa la proporción de varianza de Y explicada por X (el 57'11%) c) sY X. La estadística descriptiva es, junto con la inferencia estadística o estadística inferencial, una de las dos grandes ramas de la estadística. . ' . POLÍGONOS DE FRECUENCIAS : Si la frecuencia representada no es acumulada, enlazamos los puntos medios de los extremos superiores de los rectángulos. a) 8x8 = 64 (por cada línea de ida puede tomar las ocho de vuelta) b) 8x7 = 56 (por cada línea de ida puede tomar lsólo siete de vuelta) Probabilidad (F. Álvarez) - 9 c) 8 (las ocho líneas) 16 Sabemos que de cada 10000 mujeres 25 sufren de daltonismo y 5 de cada 100 hombres también tienen la misma anomalía. Esto condicionará en gran medida su posterior tratamiento. S X Y= + En efecto : S X Y N X Y N X N Y N X Yi i i i i i= + = + = + = + ∑ ∑ ∑ ∑ ∑( ) Análogamente se verifica que : D X Y= − Calculemos la varianza de la suma S : ( ) ( ) ( ) ( ) S X Y S N X Y X Y N X X Y Y N X X Y Y X X Y Y N X X N Y Y N X X Y Y N S S S S i i i i i i i i i i i i i i X Y XY 2 2 2 2 2 2 2 2 2 2 2 2 2 = + − = + − + = − + − = = − + − + − − = = − + − + − − = + + ∑ ∑ ∑ ∑ ∑ ∑ ∑ ( ) ( ) ( ) ( ) ( ) ( ) ( ) . El primer test dio como media 5 con varianza 2 y, el segundo, media 38 con varianza 12. Elija razonadamente, calcule e interprete el coeficiente de correlación adecuado, para estudiar la relación entre las puntuaciones de la prueba y la variable sexo. ( ) 3 . Este signo es el de b y b', ya que es el que proporciona la covarianza. X b) 39’98 y 7’96 c) 0’9093 17 a) YM’ = 1'9317 + 0'9049 . . ! === ∑ N an x ii Varianza 4'42667'15 60 14252. EJEMPLO : CAMBIO DE VARIABLE. La tabla de porcentajes acumulados del apartado b) nos permite deducir que : Los percentiles 40 y 60 se encuentran en el intervalo [165,170) . d) Calcule su varianza residual. . Desviación media xx − xxn −. La segunda autonomía . Se trata de analizar la relación que puede existir entre las dos enfermedades. ' . ' La norma que hemos de seguir en la construcción de un gráfico estadístico es siempre : "La zona que identifica a cada valor será proporcional a su frecuencia" Los diagramas usuales son los que se describen a continuación. 378 382 100 1200.60 165.100 .60 1 60 = − += − += − i i i i an NN eP 18 - Estadística descriptiva (F. Álvarez) 6 Partiendo de la siguiente distribución de frecuencias acumuladas, determinar la media, mediana y moda de la siguiente distribución de edades. .= = 0 8392 Para el pronóstico tipificado 1'1868 deduciremos el valor tipificado de X. Teniendo en cuenta el proceso de tipificación, deduciremos la puntuación directa de X z z X X s X XY X X ' ' ' ' ' ' ' . . ; .= − − = − = +1 3 1 1 33 2 3 3 Se consideran observaciones atípicas aquellas que quedan fuera del intervalo : ( Linf , Lsup ) OTRAS MEDIDAS ESTADÍSTICAS. . Se verifica entonces que : Pr( / ) Pr( ).Pr( / ) Pr( ).Pr( / ) A B A B A A B A k k k i i i n= = ∑ 1 Probabilidad (F. Álvarez) - 3 EJERCICIOS RESUELTOS 1 Al extraer al azar una ficha del juego del dominó, calcular la probabilidad de que sume un número de puntos múltiplo de 3. Introducción a la estadística, distribuciones de frecuencias, gráficos estadísticos, medidas de tendencia central, dispersión, posición y forma, con ejemplos resueltos en Microsoft Excel ® … Lo primero que debes hacer es pulsar el botón de Análisis de datos el cual se encuentra en la ficha Datos y marcar la opción de Estadística Descriptiva. ! a) Considerando a todos los alumnos, ¿ cuál es la probabilidad de aprobar el examen ?. ... . . Denominamos X e Y a las variables que proporcionan, respectivamente, las clasificaciones en Matemáticas y en Filosofía. b) Relación perfecta. 20 La ecuación de la recta de regresión que permite pronosticar las calificaciones en Psicología Matemática II (Y) a partir de las calificaciones en Psicología Matemática I (X) es la siguiente : Y’ = 0’8.X - 0’25 Sabiendo que Sx = (4/5).Sy ; Sy = 3 y que X Y− = 174' , calcule : a) r X Yxy , , . ¡Descarga Ejemplo trabajo estadística y más Ejercicios en PDF de Estadística solo en Docsity! La mitad de los alumnos eligen el problema A, y de éstos aprueban el 60%. El número de días necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de … Por último, entre los que eligen el C aprueban el 30%. De los 50 alumnos, una proporción de 0’6 comían en el Colegio. El apartado e) es aconsejable resolverlo a partir del suceso contrario (ser del mismo palo). 10 - Regresión y correlación (F. Álvarez) d) Varianza residual : ( ) ( )( ) 0379'09648'01.5482'01. La primera (Tacanyuna) tiene dos habitantes cuyas rentas personales son 30 y 25 M (miles de euros). . Los métodos de Análisis Exploratorio o Estadística Descriptiva ayudan a comprender la estructura de los datos, de manera de detectar tanto un patrón de comportamiento general como apartamientos del mismo. A mayor puntuación en el test mayor prejuicio antiprotestante. Un profe ha elaborado examen con 10 preguntas, antes de utilizarlo como elemento de evaluación quiere saber las propiedades, una de esas es que no todas tengan un nivel de dificultad … TEOREMA DE PROBABILIDADES TOTALES : Pr(A ∪ B) = Pr(A) + Pr(B) - Pr(A ∩ B) Generalizando : Pr( . d) Obtener el valor de la mediana, del percentil 29 y de la amplitud semi-intercuartílica. Construimos así una tabla como la de la izquierda. Ejercicios Resueltos: -Clasificación de variables -Gráficos estadísticos -Medidas de ubicación -Medidas de variabilidad poblacional y muestral -Aplicación de. VARIANZA : ( ) 2 22 22 .. x N xn N xxn s iiii −= − == ∑∑σ Es la media de los cuadrados de las desviaciones o separaciones de cada una de las observaciones, respecto a la media aritmética. ' . ' Alumno 1 2 3 4 5 6 7 8 9 10 Inicio 4 5 1 5 2 3 2 1 1 3 Final 6 8 5 9 3 6 7 6 4 9 a) Determine la media, desviación típica, mediana y moda de las calificaciones al inicio y al final del curso. x = 0'8 . No ser del mismo palo se presenta cuando, por ejemplo, dos son de oros y la otra de copas. Puedes contactarnos para poder brindarte ayuda en Asesor Universitario. Se subdivide en dos bloques : 1º Estadística primaria : Obtenido un grupo de observaciones experimentales, este apartado nos enseña a ordenarlas adecuadamente, de modo que se ofrezca una información lo más clara posible. Calculando el valor aproximado de ϕ , podremos medir el grado de asociación : ϕ ≈ = = rt 15 056958 15 0 37972 ' ' ' ' ⇒ baja relación entre las variables 35 Con el fin de estudiar si existe o no relación entre las calificaciones en Matemáticas y en Filosofía de COU, seleccionamos seis alumnos. EJERCICIO 1. 10 31)Pr(1)lgPr( 6 =−=⎟ ⎠ ⎞ ⎜ ⎝ ⎛−=−= darnovezunaadar 8 - Probabilidad (F. Álvarez) 13 En las pruebas de acceso a la Universidad, el 45% son alumnos de la opción A, el 10% de la B, el 30% de la C y el resto de la opción D. Se sabe que aprueban el 80% de los alumnos de la opción A, la mitad de los que cursaron las opciones C y D y el 60% de los de la opción B. Si un cierto alumno aprobó la prueba, calcule la probabilidad de haber cursado la opción C. Ejemplo clásico de aplicación del Teorema de Bayes. de correlación lineal). En este caso, el polígono de frecuencias NO se construiría enlazando los puntos medios de los extremos superiores de las franjas, sino como se indica en la figura. 1200 / 100 n P N [145,150) 0'3 3'6 4 0'3 4 [150,155) 1'6 19'2 19 1'9 23 [155,160) 9'4 112'8 113 11'3 136 [160,165) 20'5 246 246 31'8 382 [165,170) 31'5 378 378 63'3 760 [170,175) 22'5 270 270 85'8 1030 [175,180) 10'7 128'4 128 96'5 1158 [180,185) 3'5 42 42 100'0 1200 N=1200 c) Estaturas n x n.x n.x2 [145,150) 4 147'5 590'0 87025'00 [150,155) 19 152'5 2897'5 441868'75 [155,160) 113 157'5 17797'5 2803106'25 [160,165) 246 162'5 39975'0 6495937'50 [165,170) 378 167'5 63315'0 10605262'50 [170,175) 270 172'5 46575'0 8034187'50 [175,180) 128 177'5 22720'0 4032800'00 [180,185) 42 182'5 7665'0 1398862'50 1200 201535'0 33899050'00 De aquí resulta : x = =201535 1200 167 95' sx 2 233899050 1200 167 95 42 006= − =' ' sx = =42 006 6 481' ' d) La quinta parte representa el 20%. 8 Para analizar si existe o no relación entre las calificaciones en materias científicas y las del área literaria, seleccionamos ocho alumnos a los que sometemos a dos pruebas (una de cada área). Los varones presentan altas puntuaciones en ansiedad y las mujeres bajas. ( ). ' . Edad N n x n.x n.x2 [10,12) 4 4 11 44 484 [12,14) 11 7 13 91 1183 [14,16) 24 13 15 195 2925 [16,18) 34 10 17 170 2890 [18,20] 40 6 19 114 2166 40 614 9648 x = =614 40 15 35' Lugar que ocupa la mediana : L = 50 . Estadística Descriptiva Facultad Ciencias Económicas y Empresariales Departamento de Economía Aplicada Profesor: Santiago de la Fuente Fernández 1. Con esto los intervalos serían : [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) [70,80) [80,90] Si partimos de la decisión de que los intervalos tengan 15 unidades de amplitud, simplemente iniciaremos su construcción hasta llegar a un intervalo que contenga al valor máximo observado. Una persona ha aprendido la habilidad, ¿ cuál es la probabilidad de que haya seguido el método A ?. Estadística descriptiva (F. Álvarez) - 43 5 Ordenar las cuatro distribuciones siguientes de mayor a menor dispersión. xi Ti = Σ ti. (B = NO recibir descarga) P(A1) = P(A) = 1/3 P(B/A1) = 1/4 P(A2) = P(B) = 1/3 P(B/A2) = 3/4 P(A3) = P(C) = 1/3 P(B/A3) = 1 P A B P A B( / ) . 1.-. Pr( ) Pr( ) Pr( )A A A1 2 3 1 3 = = = Pr( / ) Pr( / ) Pr( / )B A B A B A1 2 3 2 5 4 5 3 5 = = = La probabilidad pedida es : Pr( / ) . Generalizar este resultado y demostrar que si en una distribución de frecuencias de media m, se sustituyen los valores xi por xi + A, manteniendo las frecuencias, la media m' de la nueva distribución verifica : m'= A + m c) Utilizando la igualdad obtenida, ¿cómo podría calcularse más fácilmente la media de la distribución siguiente ? Qi = (Ti.. /T).100 Pi - Qi 1 4 4 20 4 4 5'195 14'805 2 3 7 35 6 10 12'987 22'013 3 3 10 50 9 19 24'675 25'325 4 2 12 60 8 27 35'065 24'935 5 3 15 75 15 42 54'545 20'455 6 2 17 85 12 54 70'130 14'870 7 1 18 90 7 61 79'221 10'779 8 2 20 100 16 77 100 0 N = 20 TP = 515 T = 77 TD =133'182 Uniendo el origen del rectángulo (0 , 0) con los sucesivos puntos (Pi , Qi) obtenemos la curva de Lorenz de la derecha. . ' ' ' C suspenso C suspenso C A suspenso A B suspenso B C suspenso C = + + = = + + = = 0 20 0 70 0 50 0 40 0 30 0 25 0 20 0 70 0 14 0 415 0 3373 Método 2º : a) Pr(aprobar) = (30+22’5+6) / 100 = 58’5 / 100 = 0’585. f) Compare los resultados obtenidos en los apartados a), b) con los de los apartados c), d). COEFICIENTE DE VARIACIÓN : CV x x= σ .100 Mide la representatividad de la media. c) la proporción de varianza de la variable Y no asociada a la variación de X. Datos : Y a b X a b a b r SX' . ' 0'3679 = 0'55185 ≈ rt Esto permite tener una referencia sobre el intervalo (-1 , 1), a la hora de interpretar el valor obtenido con el coeficiente de correlación tetracórica. . ' . X d) r = 0'6067 e) η2 = 0’3749 (próximo a r2 = 0'3681) 18 (I) Coeficiente biserial rb = - 0'7250 (II) Coeficiente τ de Kendall τ = - 0'3333 (III) Coeficiente tetracórico rt = - 0'7744 2 - Probabilidad (F. Álvarez) REGLA DE LAPLACE : La probabilidad de un suceso es el cociente entre el número de situaciones en que puede presentarse dicho suceso y el número total de situaciones posibles. ¿Y el C ? . ' s s rY X Y. . ' x b) r = 0'909 zy' = 0'909 . ' . ' TABLAS DE FRECUENCIAS. Aquí vamos a analizar la clasificación de las variables estadísticas y veremos muchos ejemplos y ejercicios resueltos en los videos que hemos preparado. Por. ' . ' La amplitud de cada sector será : º360.º360. . Patricio Alcaíno Martínez. xi Σ ni . Ejercicio de estadística descriptiva. Intervalos x Recuento n N [ e1 , e2 ) x1 /// n1 n1 [ e2 , e3 ) x2 ///// ///// / n2 n1+n2 . El valor 19 se encuentra en el intervalo [13'5,20'5) : En el grupo A : P k kk = = + − → =19 135 40 100 10 9 7 42 68' . 10 EJEMPLOS DE VARIABLES CUANTITATIVAS DE RAZON. 8 - Regresión y correlación (F. Álvarez) EJERCICIOS RESUELTOS 1 La tabla siguiente contiene los resultados de las calificaciones en Matemáticas (X) y Lengua (Y) de un grupo de 40 alumnos de Secundaria. Contenidos 1. Estadística Descriptiva en datos tabulados 2. Cálculo de Media Aritmética, Desviación estándar, Mediana, Coeficiente de Variación y Percentil Debo saber En seguida se muestran algunas definiciones que son necesarias se tengan claras antes de empezar a trabajar en los contenidos: El no tomar en consideración a la totalidad de las observaciones, hace pensar que esta medida es poco representativa. '3 1 3 1 1 3 1 4 1 3 3 4 1 3 1 05= + + = Puede resolverse sin necesidad de aplicar el Teorema de Bayes. • Valores próximos a cero implican falta de relación entre las variables (independencia). ( )1. En términos de varianzas : ( ) ( ) ( )∑∑∑ −+−=− 222 '' YYYYYY ( )∑ − 2YY = ( )∑ − 2'YY + ( )∑ − 2' YY Varianza total Varianza no explicada por X (varianza de los errores o residual) Varianza explicada por X Dividiendo los sumandos anteriores por la varianza de Y obtendremos la proporción de varianza de Y no explicada y explicada por la variable X. Regresión y correlación (F. Álvarez) - 15 9 Un grupo de COU integran 17 alumnos de Ciencias y 14 de Letras. Apliquemos el primer procedimiento para calcular la mediana y el 9º decil : La mediana (percentil 50) ocupará el lugar : L = 50 . 6) Estas son las medidas estadísticas de un estudio sobre el número de roturas que sufrieron unas varillas a las que se les sometió a una prueba. ¿ Cuál es el valor de su media aritmética ?. - Nmero de hijos. . . . - Numero de artefactos elctricos que existen en el hogar. . ' a) Al referirse a intervalos de 5 cm. . Con ejercicios y problemas resueltos. 6 - Estadística descriptiva (F. Álvarez) AMPLITUD SEMI-INTERCUARTÍLICA : Q Q Q = −3 1 2 Esta medida de dispersión se basa en medidas de posición (Cuartiles),.Su empleo tendrá sentido en el supuesto de imposibilidad de cálculo de la media. Resulta así : X = 5 +5 = 10 , Y = 10 , S = 2 , S = 3, S = 4' 8X Y XY Luego : b S S a Y b X Y XXY X = = = − = − = − → = − +2 12 10 12 10 2 2 12' . ' X en puntuaciones diferenciales : y' = 0'8 . Regresión y correlación (F. Álvarez) - 29 36 Con el fin de estudiar si existe o no relación entre las calificaciones en Matemáticas y en Filosofía de COU, seleccionamos 30 alumnos analizando la puntuación final en cada materia . '100 77 91 19 8 100 44 58% 100 63 21 16 3 100 48 78% luego, concluimos que el grupo B presenta una mayor variabilidad relativa (44'58 < 48'78), en contra de lo obtenido comparando varianzas. El Coeficiente de Variación de Pearson es invariante ante un cambio de escala. Con esto, la probabilidad pedida será : Pr . . b) Cuál es la muestra y cuál es la población de la que proviene. . . . . . . . ' Se trata de analizar la relación que puede existir entre la especialidad (Ciencias o Letras) y el ser repetidor o no serlo. EJERCICIOS ESTADISTICA DESCRIPTIVA . σ − = )Mdx. POLÍGONO DE FRECUENCIAS : Obtenidos enlazando los extremos superiores de las barras. 29 Elija el coeficiente de correlación más apropiado entre las variables “puntuaciones en un test de inteligencia” (X), y “prejuicio antiprotestante” (Y), teniendo en cuenta el cuadro adjunto. 3 De la siguiente distribución bivariante : Y [0,1) [1,2) [2,3] X 2 1 2 1 3 3 6 3 4 1 2 1 a) Calcule e interprete el valor de la covarianza. . Decreciente (pendientes b y b' negativas) CURVA DE REGRESIÓN DE LA MEDIA Este método es aplicable cuando una de las dos variables (o las dos) contiene un bajo número de valores distintos. ' . ' Utilice para ello el índice de asociación más apropiado. . • Padecen ambas 50% de 1000 500 • No padecen ninguna 40% de 1000 400 • Padecen sólo diabetes La mitad de los 100 restantes 50 • Padecen sólo ceguera La mitad de los 100 restantes 50 Dispuesta la tabla como sigue (totalizando filas y columnas) obtenemos : Y - Ceguera 1 (Padece) 0 (No padece) X 1 (Padece) a = 500 b = 50 550 Diabetes 0 (No padece) c = 50 d = 400 450 550 450 ( ) ( ) ( ) ( ) ϕ = − + + + + = − = ⇒ ad bc a b c d a c b d. . , o, con mayor rigor : ( ) S n S n n x X n i i i i i i 2 2 2 = + −∑ ∑ ∑ ∑ . Σni = N Σri = 1 Σpi = 100 EJEMPLO : x n r p N R P 2 5 0'125 12'5 5 0'125 12'5 3 10 0'250 25 15 0'375 37'5 4 16 0'400 40 31 0'775 77'5 5 6 0'150 15 37 0'925 92'5 6 3 0'075 7'5 40 1'000 100 40 1 100 GRÁFICOS ESTADÍSTICOS. La estadística descriptiva consiste en poner en práctica diferentes tipos de técnicas numéricas y también gráficas con las que se pueden analizar y, en consecuencia, describir un conjunto de … Si los datos se agrupan en intervalos, es el número de observaciones que pertenecen a dicho intervalo. . Download Free PDF. ' ' . ' Interprete el significado de la razón de correlación calculada. 44 4 −=−=− − = ∑ σ N xxn K ii Estadística descriptiva (F. Álvarez) - 17 5 La distribución de las estaturas en centímetros de los alumnos de un centro, expresados en porcentajes, es la siguiente: Estaturas Porcentajes Menos de 150 0'3 De 150 a 154 1'6 De 155 a 159 9'4 De 160 a 164 20'5 De 165 a 169 31'5 De 170 a 174 22'5 De 175 a 179 10'7 De 180 y más 3'5 a) Siendo abiertos los intervalos primero y el último, ¿ qué valores sería razonable considerar para los límites extremos de esos intervalos ? Excel cuenta con una herramienta la cual se le conoce como Estadística Descriptiva. EJERCICIOS ESTADISTICA DESCRIPTIVA . b) Calcular la moda. ( ) S f X X N f X N XX i i i i i i2 2 2 2= − = − ∑ ∑. . Calcularemos pues el coeficiente de correlación por el método de los rangos de Spearman. . - Nmero de goles marcados en un partido de futbol. σ N xxn As ii∑ − = Estadística descriptiva (F. Álvarez) - 7 Basados en al relación existente entre media, mediana y moda : x Mo x Md− = −3. Mediana : N/2 = 40 ⇒ Me = 2 Moda = 1 x n N n.x n.x2 xx − 3). 'A B2 1 3 4 5 1 3 2 5 1 3 4 5 1 3 3 5 4 9 0 444= + + = = Sería correcto, en este caso, resolver el problema en base al conocimiento simple de que la bola extraída es blanca. SUMA Y DIFERENCIA DE VARIABLES. ¿ Existe una relación entre ser hijo único o no y comer o no en el Colegio ?. CUANTITATIVAS Los valores de las observaciones son numéricos (cuantificables) y, en consecuencia, ordenables. INTERPRETACIÓN Determina la forma de la distribución, en relación con su grado de aplastamiento. Llámanos 964244555 y conoce todos nuestros beneficios. a) Coeficiente de correlación ρ : ( ) ( ) 9301'0112.12 552.61 1. '= + + = =1 3 2 5 1 3 4 5 1 3 3 5 9 15 0 6 b) Aplicación del Teorema de Bayes. xi ni ri = ni / N pi = ri . 60 / 100 = 54 x n N 0 8 8 1 11 19 2 13 32 ⇐ Mediana = 2 3 15 47 4 10 57 ⇐ 9º decil = 4 5 3 60 N = 60 Aplicando el segundo procedimiento descrito, determinemos los cuartiles 1º y 3º, así como la amplitud semi- intercuartílica : x n r p P 0 8 0'1333 13'33 13'33 1 11 0'1833 18'33 31'67 ⇐ Cuartil 1º (percentil 25) = 1 2 13 0'2167 21'67 53'33 3 15 0'2500 25'00 78'33 ⇐ Cuartil 3º (percentil 75) = 3 4 10 0'1667 16'67 95'00 5 3 0'0500 5'00 100'00 N = 60 1'0000 100'00 Amplitud semi-intercuartílica = Q Q3 1 2 3 1 2 1 − = − = Estadística descriptiva (F. Álvarez) - 13 2 Trabajamos ahora con las edades de 50 jóvenes de nuestro barrio : 1 11 20 15 10 4 12 20 5 23 9 12 13 14 15 24 15 7 8 12 9 9 5 2 20 13 15 7 11 22 20 6 12 4 7 1 18 20 11 10 14 20 11 13 15 21 25 20 22 10 Como en el ejemplo anterior, realicemos un estudio estadístico completo. ' . ' . ... 222 = − − = − − = ∑∑ ∑∑∑ XXN YXYXN b a Y b X Y N b X N = − = − = − =∑ ∑. . ' Individuo o elemento: Cada uno de los elementos de la población. . Las sumas TD y TP permiten obtener el índice de Gini : G TD TP = − = − = 100 133182 515 100 0 3209 ' ' Concluimos la presencia de una cierta concentración (lo cuál también se advierte con la gráfica). • D = X - Y obtenida restando a cada valor de X el valor correspondiente de Y. Esto supone la existencia de tantas observaciones de X como de Y, así como el emparejamiento de ellas; es decir, a cada valor de X queda asociado un valor de Y. Esto constituirá la base de estudio del siguiente tema . 38 Se desea estudiar si existe relación entre `padecer diabetes y ceguera en la tercera edad. La estadística descriptiva es una disciplina que se encarga de recoger, almacenar, ordenar, realizar tablas o gráficos y calcular parámetros básicos sobre el conjunto de datos. a) La pregunta es preciso detallarla con mayor precisión. TABLA DE FRECUENCIAS Observado el valor mínimo (1) y máximo (24), decidimos agrupar los datos en intervalos de 5 años de amplitud, empezando por 0. 2º.- Aplicando el puro y simple sentido común. . . El aspecto que deseamos estudiar (edad, sexo, peso, ...) recibe el nombre de VARIABLE ESTADÍSTICA. Sabiendo que el índice de asociación entre las variables ansiedad y sexo es igual a +1, y que el número de varones es superior al de mujeres : a) ¿ Qué coeficiente de correlación habrá sido utilizado ?. . . 2 De la distribución bivariante siguiente : Y 0 1 2 X 2 0 1 5 4 0 9 0 6 8 0 0 a) Obtenga la recta de regresión de Y sobre X. b) Obtenga la recta de regresión de X sobre Y. c) Calcule e interprete el coeficiente de correlación lineal. Es decir, lo contrario de no dar en ninguna ocasión. Su alto valor negativo (próximo a -1) nos indica que existe una fuerte relación entre las dos clasificaciones en las pruebas atléticas, quedando mejor clasificados en una los peor clasificados en la otra. 8 Represente el histograma correspondiente a la siguiente distribución de edades de los trabajadores de una fábrica. . ( xxn − 4). Algo que podía advertirse al analizar el recuento de las observaciones. ' 2 2 2 2 2 2 2 23 0 8 5 76= → = = = b) Si a los valores de X les sumamos 5, la nueva media se incrementa en 5, pero las medidas de dispersión se mantienen inalterables. ( ). a) Al ser dicotómica la 2ª variable, obtendremos el coeficiente de correlación biserial puntual : Y Y=1 Y=0 A = 1 S = 0 n n.X n.X2 n.X1 n.X0 X 2 2 1 3 6 12 4 2 3 5 0 5 15 45 15 0 4 10 2 12 48 192 40 8 5 4 0 4 20 100 20 0 6 3 1 4 24 144 18 6 8 1 1 2 16 128 8 8 25 5 N=30 129 621 105 24 X1 105 25 4 2= = ' X0 24 5 4 8= = ' p = = 25 30 0 833' q = = 5 30 0167' X = = 129 30 4 3' s sX X 2 2621 30 4 3 2 21 2 21 1487= − = ⇒ = =' ' ' ' Con esto : r X X s p qbp X = − = − = −1 0 4 2 4 8 1487 08330167 01505. . ' ' . ' Pr( ) Pr( ) Pr( ) . Se nos pide que calculemos los percentiles 40 y 60 de la distribución de estaturas. [ ei , ei+1 ) xi ni ni . De ellos repiten curso 16 de Ciencias y sólo 2 de Letras. ( ) '1 2 8 4 6 6 1 2 4 15 0 2667 Es decir, como ocurrió con el coeficiente ρ, existe una escasa relación entre las calificaciones en Matemáticas y Filosofía. . ?. '0 8392 2 8284 3 3705 0 7042 0 7042 4 0 7042 5 2 0 3380 La recta de regresión de X sobre Y tiene por ecuación : X' = 0'3380 + 0'7042 . . Curva de regresión de la media de Y condicionada a X : El procedimiento consiste en sustituir todos los pares de observaciones que tienen el mismo valor de X por un único par que tiene por componentes dicho valor de X y la media de los valores de Y. Este último cambio de variable recibe el nombre de TIPIFICACIÓN. Si decidimos construir 8 intervalos, la amplitud de cada uno será de 10 unidades (valor aproximado de 76/8). d) Error típico de la predicción. Haciendo uso de las propiedades de las medidas estadísticas ,podremos facilitar y simplificar los cálculos de parámetros estadísticos, realizando un cambio de variable. Obtenemos las distribuciones marginales de X y de Y totalizando las frecuencias en filas y columnas : Y 0 1 2 Σ X 2 0 1 5 6 4 0 9 0 9 6 8 0 0 8 Σ 8 10 5 23 X n n.X n.X2 Y n n.Y n.Y2 2 6 12 24 0 8 0 0 4 9 36 144 1 10 10 10 6 8 48 288 2 5 10 20 23 96 456 23 20 30 La suma de los productos de X por Y hemos de obtenerla directamente de la tabla proporcionada : ==∑∑∑ i j jiij YXnYX ... 0.2.0 + 1.2.1 + 5.2.2 + 0.4.0 + 9.4.1 + 0.4.2 + 8.6.0 + 0.6.1 + 0.6.2 = 58 Como puede observarse, sólo realizamos los productos correspondientes a frecuencias y valores de variables no nulos. b) Calcule la media y desviación típica del incremento o mejora de la calificación obtenida. Estadística descriptiva (F. Álvarez) - 11 EJERCICIOS RESUELTOS 1 La tabla siguiente nos muestra el resultado de una encuesta entre los alumnos de primer curso, analizando el número de suspensos en la primera evaluación : 0 2 2 4 0 3 3 2 5 2 3 2 4 3 4 3 1 4 1 1 0 4 1 1 4 2 4 2 0 3 1 3 0 5 2 2 3 0 3 0 5 1 1 4 0 3 2 3 2 3 3 1 2 4 2 3 1 3 1 4 Realicemos un estudio estadístico completo. . De aquí : Ml e Q Q Q ai i i i i= + − − = + − − =− − 50 6 50 22 255 63 798 22 255 2 7 33571 1 . ' . . . b) Los autobuses de ida y vuelta han de ser de diferente línea. == − = ∑ N xxn D ii Asimetría (-0'3524 < 0) Algo asimétrica hacia la izquierda ( ) 3524'0 1124'2 60 199'3244-. x1 (n1 . 6 Los precios de una chaqueta en once establecimientos fueron (en pts. ' . Luis Tineo Ancajima. 3 5 5 b) Obtenga la recta de regresión de X sobre Y. 3 Sea la siguiente distribución de frecuencias: x n 1 10 2 15 3 12 4 8 a) Calcular la media de esta distribución. . ' Té asesoramos en la solución de problemas y trabajos de Estadística Descriptiva e inferencial. '0 8 3 2 12 Para x = -2 : y’ = 1’2 . X Mujeres Hombres 11 - 13 8 3 8 - 10 6 5 5 - 7 5 6 2 - 4 1 6 X nM nM.X nH nH.X X n n.X n.X2 2-4 3 1 3 6 18 3 7 21 63 5-7 6 5 30 6 36 6 11 66 396 8-10 9 6 54 5 45 9 11 99 891 11-13 12 8 96 3 36 12 11 132 1584 20 183 20 135 40 318 2934 X X X SM H X= = = = = = = − = 183 20 915 135 20 6 75 318 40 7 95 2934 40 7 95 31862' ; ' ; ' ; ' ' r X X S p qbp M H X = − = − =. . ' . Población y muestra 6.2. B) Tipificadas : Si a todos los valores de la variable inicial x les restamos la media y el resultado lo dividimos por la desviación típica, obtenemos una nueva variable z (puntuaciones tipificadas) cuya media es cero , teniendo siempre como desviación típica la unidad. 2222.2 =−−=−== rsss YXYe e) Coeficiente de determinación : Es el cuadrado del coeficiente de correlación, representando la proporción de varianza explicada por la variable X (en el ajuste de Y sobre X). ( ) se definen dos nuevos coeficientes de asimetría (de Pearson): As x Mo 2 = − σ As x Md 3 3 = −. Calcular de cuántas formas puede un estudiante hacer el viaje de ida y vuelta, si : a) Los autobuses de ida y vuelta pueden ser de la misma o diferente línea. tratamientos, las variables que se medirán y cómo se entrenará al equipo de trabajo para el cumplimiento del protocolo. . . ' 999271'03'01 10 3. Aplicar las técnicas … . : X Y 1 4 2 1 (4,1) I 3 3 (4,3) I (1,3) P 4 6 (4,6) P (1,6) P (3,6) P 5 2 (4,2) I (1,2) P (3,2) I 6 5 (4,5) P (1,5) P (3,5) P (2,5) P En total hemos encontrado 8 permanencias (P) y 4 inversiones (I). 2 Aplicaremos la fórmula para el cálculo de percentiles para datos agrupados. Tabuladas para cada m. Coeficiente de correlación biserial rb : Puede utilizarse cuando ambas variables son continuas , pero una de ellas puede dicotomizarse artificialmente. Los cartogramas son gráficas estadísticas que usan el mapa del mundo, un continente, un país o una región determinadas para generar datos estadísticos de las mismas. Halle el coeficiente de correlación que corresponda e interprete el resultado. . ' . . ' . . === ∑ N xn x ii 00'2283'2 60 433. .6 1 22 2 = − −= − −= ∑ NN d ρ Es decir, existe una alta relación entre las calificaciones. De igual modo que se definió para las frecuencias absolutas, se definen las FRECUENCIAS RELATIVAS ACUMULADAS (R) y los PORCENTAJES ACUMULADOS (P). Esta dificultad aconseja seguir el método abreviado descrito anteriormente. Y Filosofía A S 2 2 1 X 3 5 0 Matemáticas 4 10 2 5 4 0 6 3 1 8 1 1 a) utilizando el índice adecuado, basado en el concepto de correlación de Pearson. 7 Si en una distribución de frecuencias duplicamos las amplitudes de los intervalos, ¿ qué sucederá, aproximadamente, con los valores de las frecuencias ?. ' ' ' 0 8 2 6 0 267 6 0 267 50 7 35 7 35 0 267 7 35 0 267 52 6534 b) S S r S S SY Y Y Y Y.X ' .X. Metodologías de investigación y Estadística 6. 【 2023 】 - Examen Estadística Resuelto. τ = − − N N n n p i . ( )( ) ( ) 96'0 2396 2308 2381476.40 238.2141331.40 . . Sustituyendo la media por la moda o la mediana, definiremos las desviaciones medias respecto de la moda y de la mediana. c) Si a los valores de Y les sumamos 3, la nueva media se incrementa en 3, pero las medidas de dispersión se mantienen inalterables. x zy' = -0'9129 . b) Interprete el valor del coeficiente de correlación. TABLA COMPLETA DE FRECUENCIAS : x n r p N R P x1 n1 r1 = n1 / N p1 = r1 . Supuesta X continua y Y dicotomizada (valores 1 y 0) , el coeficiente de correlación biserial se calcula del modo siguiente : r X X s p q f zb X = −1 0 . n a N P n.a n.a2 [10,12) 5 11 5 8'333 55 605 [12,14) 11 13 16 26'667 143 1859 [14,16) 19 15 35 58'333 285 4275 [16,18) 21 17 56 93'333 357 6069 [18,20] 4 19 60 100'000 76 1444 60 916 14252 Media 2667'15 60 916. Multiplicamos por , en este caso , y dividimos por . Para su aplicación rigurosa es necesario que : 1. la distribución de la variable o variables consideradas continuas debe ser "normal". Facultad de Ciencias del Trabajo Métodos Estadísticos Aplicados a las Auditorías Sociolaborales Francisco Álvarez González Octubre 2005 Estadística descriptiva (F. Álvarez) - 1 ESTADÍSTICA DESCRIPTIVA Métodos Estadísticos Aplicados a las Auditorías Sociolaborales Francisco Álvarez González francisco.alvarez@uca.es Bajo el término “Estadística Descriptiva” se engloban las técnicas que nos permitirán realizar un análisis elemental de las observaciones experimentales observadas. UTP del Perú SEMANA 2 Estadística Descriptiva y Probabilidades EJERCICIOS RESUELTOS 1. , S = 3, S = 4' 8.X Y XY2 4 2 9 6= = ' Luego : b S S S S b a Y b X Y XXY X XY X = → = = = − = − = → = +2 2 2 2 2 2 4 0 6 13 0 6 10 7 7 0 6 . La media x viene dada por: x = 1 40 … ... Trabajo quimica - … . (-1) ⇒ y' = -0'8 NOTA : Calculado b = 0'8 > 0, concluiremos que el coeficiente de correlación es también positivo (r = 0'8627), tal como se dedujo en el apartado a). Por ejemplo : Estado civil ; Color preferido ; Nivel de estudios ; Raza ; ... Dentro de ellas podremos subdividirlas en función de que puedan ser ordenadas (Nivel de estudios) o no tenga sentido una determinada ordenación que se establezca (Color preferido, Razas, ...). . ' Pi = (Ni.. /N).100 ti = ni. . . ' ejercicios resueltos de estadística I ESTADÍSTICA I Práctico: Unidad 1 – Estadística Descriptiva En los siguientes ejemplos, determinar: a) Cuál es la/s variable/s en estudio y de qué tipo son cada una de ellas (discreta, continua, cualitativa, cuantitativa). Construimos una tabla, con las columnas necesarias para calcular la media estadística, moda, mediana y desviación típica. ( ). EJERCICIOS RESUELTOS. Clasificados por orden de puntuación resultó : Alumno 1 2 3 4 5 6 7 8 P. Científica 3º 6º 7º 1º 2º 8º 5º 4º P. Literaria 3º 5º 7º 4º 1º 8º 2º 6º Utilizando el índice adecuado establezca el grado de relación que existe entre las calificaciones de dichas áreas de conocimiento. GRÁFICO DE VARIABILIDAD : Basado en los cuartiles, adopta la forma del gráfico de la derecha. Calcule el coeficiente de correlación elegido y comente brevemente el resultado obtenido. OTROS COEFICIENTES DE CORRELACIÓN NO BASADOS EN EL PEARSON Coeficiente de correlación tetracórica: Puede utilizarse cuando ambas variables son continuas , pero ambas pueden dicotomizarse artificialmente. Webtrabajos importantes relacionados con el Cálculo Diferencial, sobresaliendo entre otros, los siguientes: Pierre Fermat (1601-1665), matemático francés, quien en su obra habla de los métodos diseñados para determinar los máximos y mínimos, acercándose casi al descubrimiento del Cálculo Diferencial, mucho antes que Newton y Leibniz. La relación entre las variables X , Y será de tipo lineal, cuanto más próximo sea η2 a r2. Creciente (pendientes b y b' positivas) próximo a -1 Variables relacionadas inversamente (cuando una aumenta la otra disminuye) Buena recta de ajuste. PROPIEDADES DE LAS MEDIDAS ESTADÍSTICAS. . ' . ' 2 = 1'5097 3 X =5'5 sX 2 = 8'25 Y =4'05 sY 2 = 1'8225 sXY = 3'175 a) a = 1'9333 b = 0'3848 Y' = 1'9333 + 0'3848 . r N n ==α 12 - Estadística descriptiva (F. Álvarez) MEDIA, VARIANZA Y DESVIACIÓN TÍPICA x n n.x n.x2 Este tipo de tabla facilita los cálculos. . c) Determinar su media aritmética, varianza y desviación típica. d) 4049'0 9880 4000 3 40 1 10 . (I) Y (II) (ordinales) X 0 1 X A B C D E F -2 6 1 Y C F D E A B -1 4 4 0 2 6 1 0 5 (III) Y 2 1 8 1 0 X 1 2 40 0 50 8 34 - Regresión y correlación (F. Álvarez) SOLUCIONES DE LOS EJERCICIOS PROPUESTOS 1 X =5'12 sX 2 = 0'7456 Y =1'96 sY 2 = 1'1584 sXY = 0'8448 a) b = 1'133 y' = 1'133 . final x final final s2.s C.V 0,4730 (47,30%) x2.x d) Grado de concentración de las notas de este examen. Para este ejemplo el Coeficiente de Variación de Pearson, Vp, toma el valor: 100 70,869 1,68 1,19062 vp = ⋅ = En cuanto a la simetría, el Coeficiente de Variación de Pearson, Ap,es igual a: … ϕ = 1'5 . ' ' . . Estadística descriptiva y estadística inferencial 6.1. 11 1 = + += + += −+ + i ii i i ann neMo Intervalos n x n.x n.x2 [ 0 , 5 ) 5 2'5 12'5 31'25 [ 5, 10 ) 10 7'5 75'0 562'50 [ 10 , 15 ) 16 12'5 200'0 2500'00 [ 15 , 20 ) 6 17'5 105'0 1837'50 [ 20 , 25 ] 13 22'5 292'5 6581'25 N = 50 685'0 11512'50 16 - Estadística descriptiva (F. Álvarez) 4 Interv. Té asesoramos en la solución de problemas y trabajos de Estadística Descriptiva e inferencial. 10 A la izquierda se muestra el gráfico representativo de las frecuencias absolutas acumuladas de la distribución de edades de 40 individuos. . . ' . 2º Si a.d > b.c , calculamos el cociente : C = a.d / b.c (el coeficiente de correlación será positivo) 3º Si a.d < b.c , calculamos el cociente : C = b.c / a.d (el coeficiente de correlación será negativo) 4º Consultando la tabla de cálculo del coeficiente de correlación tetracórico, localizamos el cociente C en el intervalo que lo contiene (con extremos A y B). Estadística: es la rama de la matemática que nos permite recoger, organizar y analizar datos. [Luis Rubio Andrada; Rocío … . .A A A A A A A A A1 2 3 1 2 1 3 1 2∩ ∩ ∩ = ∩ TEOREMA DE BAYES : Sean n causas independientes Ai con probabilidades Pr(Ai) conocidas y sea B un suceso que puede presentarse en cada una de ellas, siendo conocidas las probabilidades Pr(B/Ai). Siendo las dos variables dicotómicas, calculamos el coeficiente de correlación ϕ (phi) . ( ) Siendo : X1 la media de los valores de X que se corresponden con un 1 en Y. X0 la media de los valores de X que se corresponden con un 0 en Y. . Alturas : 15 10 (20/2) 24 (48/2) 6 (24/4) 9 x n 0 2 1 8 2 20 x = Me = Mo = 2 3 8 4 2 40 10 a) x = 4'7 ; Me = 5 ; Mo = 6 b) 20 11 CV = 15'789 12 15 , 15 , 15'667 , 16'333 13 ( ) 3 3. σ N xxn As ii∑ − = = - 0'299561 ligeramente asimétrica a la izquierda σ − = MoxAs1 = 0'036786 ligeramente asimétrica a la derecha (prácticamente simétrica). . . ' Analice la relación entre ellas. 26 - Estadística descriptiva (F. Álvarez) 13 a) Determine el número de hombres con edades comprendidas entre los 11 y 15 años. Tal suceso se puede dar o puede proceder de la opción A (A1), de la B (A2), de la C (A3) o de la D (A4). ¿ Qué transformación lineal hemos de realizar con ella, para obtener una nueva variable Y que tenga por media 42 y desviación típica 10 ?. . EJERCICIOS RESUELTOS DE VARIABLE ESTADÍSTICA BIDIMENSIONAL 1. 31’66 / 100 = 12’664 ≈ 13 hombres b) Calculamos las varianzas de ambos grupos : x s sx x= = = − = = = 688 40 17 2 12550 40 17 2 17 91 17 91 4 2322 2' ; ' ' ; ' ' y s sy y= = = − = = = 4315 25 17 26 7752 25 25 17 26 121824 12 1824 3492 2 ' ' ; ' ' ' ; ' ' Siendo 17’91 > 12’1824 ⇒ Grupo hombres más disperso de forma aboluta Pese a ser las medias prácticamente iguales, debemos emplear el coeficiente de variación para estudiar la variabilidad relativa de ambos grupos : CV CVx y= = = = 4 232 17 2 100 24 605% 349 17 26 100 20 220% ' ' . ' c) la proporción de varianza error cometida al pronosticar, utilizando la recta de regresión anterior. . . En relación con la desviación típica s b s b b aY X= ⇒ = ⇒ = ⇒ = − =. Se trata de calcular la probabilidad de dar en el centro de la diana alguna vez. PROBLEMA 7 : Los pesos de 100 animales (en kg) están comprendidos entre 10 y 38. .. −=−=−=−= ∑ ∑∑ YX N YX YX N YXn s i j jiij XY a) Recta de regresión de Y sobre X : b s s a Y b XXY X = = − = − = − = − − =2 1 1078 2 4045 0 4607 0 8696 0 4607 4 1739 2 7925' ' ' . ' ' . ' Estadística: es la rama de la matemática que … Y x' = -0'4167 .y zx' = -0'9129 . Pr( ).Pr( / ).Pr( / ). '= = = = − = − ⇒ = + =1 1868 1 1868 0 8392 1 4142 4 2 8284 1 4142 2 8284 4 8 15 En un grupo de 10 sujetos se han aplicado dos pruebas (X,Y). Intervalos recuento n r p N R P [ 0 , 5 ) ///// 5 0'10 10 5 0'10 10 [ 5, 10 ) ///// ///// 10 0'20 20 15 0'30 30 [ 10 , 15 ) ///// ///// ///// / 16 0'32 32 31 0'62 62 [ 15 , 20 ) ///// / 6 0'12 12 37 0'74 74 [ 20 , 25 ] ///// ///// /// 13 0'26 26 50 1'00 100 Totales : N = 50 1'00 100 GRÁFICOS ESTADÍSTICOS HISTOGRAMA : Sobre el valor de cada variable dibujamos una franja con altura igual a la frecuencia que deseamos representar (en este caso las absolutas n ). Con ello corregimos el haber tomado cuadrados de separaciones en el cálculo de la varianza. Denominando Y a las puntuaciones en el test A (variable dependiente en el ajuste) y X a las correspondientes al text B, procedemos a realizar los cálculos necesarios : X Y X2 Y2 X.Y 3 4 9 16 12 4 5 16 25 20 5 5 25 25 25 5 6 25 36 30 6 7 36 49 42 7 8 49 64 56 8 8 64 64 64 9 10 81 100 90 10 11 100 121 110 12 14 144 196 168 69 78 549 696 617 ( )( ) ( ) 0809'1 69549.10 78.69617.10 . . ' En este curso aprenderemos estadística desde un nivel cero hasta un nivel avanzado con decenas de ejercicios y problemas con solución. Calcularemos el coeficiente de correlación ρ (rangos de Spearman) al presentarse dos variables ordinales (dos reordenaciones de los 8 alumnos). Teorema de Bayes. Regresión y correlación (F. Álvarez) - 33 15 En un grupo de 10 alumnos se han obtenido las calificaciones en Anatomía, separando el ejercicio teórico del práctico. ' ' ' A aprobado A aprobado A A aprobado A B aprobado B C aprobado C = + + = = + + = = 0 50 0 60 0 50 0 60 0 30 0 75 0 20 0 30 0 30 0 585 0 5128 c) Teorema de Bayes : Pr( / ) Pr( ).Pr( / ) Pr( ).Pr( / ) Pr( ).Pr( / ) Pr( ).Pr( / ) ' . ' El proceso seguido en el estudio estadístico de una cierta característica o variable, puede subdividirse en tres pasos sucesivos : A RECOGIDA DE DATOS : Planteado el test o encuesta oportuno y recogidos los datos que correspondan, el primer análisis que realizaremos es el del tipo de variable que pretendemos estudiar (Cualitativa o Cuantitativa ; Discreta o Continua). Tipificando ambas calificaciones se obtiene : Nota del test 1º : 5 4 5 4 5 2 0 2831' ' '→ = − =z Nota del test 2º : 41 41 38 12 0 8661→ = − =z ' La nota obtenida en el segundo test es superior a la del primero en términos comparativos. CONSTRUCCIÓN DE INTERVALOS : Teniendo en cuenta la amplitud total de las observaciones (Valor máximo menos valor mínimo observados), tomaremos una decisión sobre el número total de intervalos, o bien sobre la amplitud o tamaño de los mismos. DESVIACIÓN TÍPICA : 2 2. var x N xn ianzas ii −=== ∑σ Es la raíz cuadrada de la varianza. . b) Comparamos cada valor de Y con los Yi siguientes, contando una permanencia si Y < Yi y una inversión si Y > Yi. . ... . Interv. '0 8 2 3 4 8 a) Varianza de los pronósticos : SY'2 Obtenida de la relación que proporciona la proporción de varianza explicada por el ajuste : S S r S S rY Y Y Y ' ' . . (Elija, calcule e interprete el coeficiente de correlación adecuado). b) Coeficiente de asimetría de Fisher. ; ' ' . ' x zy' = 0'1944 . Conocidos los coeficientes de regresión puede calcularse como : r b b= = =. ' EJERCICIOS RESUELTOS DE ESTADÍSTICA BIDIMENSIONAL. b) Teorema de Bayes : Pr( / ) Pr( ).Pr( / ) Pr( ).Pr( / ) Pr( ).Pr( / ) Pr( ).Pr( / ) ' . ' 10 3. ' ' ' . ' 14 A las puntuaciones directas 2 y 6 de la variable X le corresponden predicciones 3'2 y 7'2 respectivamente. Los resultados son los siguientes : Sujeto 1 2 3 4 5 6 7 8 9 10 X B A B A A B B A A B Y 5 3 3 0 1 3 2 0 1 2 Elija y calcule el índice de correlación adecuado para medir la relación existente entre X e Y. Regresión y correlación (F. Álvarez) - 19 X nA nA.X nB nB.X X n n.X n.X2 0 2 0 0 0 0 2 0 0 1 2 2 0 0 1 2 2 2 2 0 0 2 4 2 2 4 8 3 1 3 2 6 3 3 9 27 4 0 0 0 0 4 0 0 0 5 0 0 1 5 5 1 5 25 5 5 5 15 10 20 62 X X X SA B X= = = = = = = − = 5 5 1 15 5 3 20 10 2 62 10 2 14832; ; ; ' r X X S p qbp A B X = − = − = −. Sexo M H Nº de multas 1 9 0 en el último año 2 7 0 3 6 2 4 1 9 5 1 11 6 0 18 ¿ Qué conclusión puede deducirse acerca de la relación existente entre sexo y número de denuncias ?. Una cuantitativa y la otra dicotómica. 6 8 3 7 7 6 8 8 2 Tabla de cálculos : X Y n n.X n.Y n.X2 n.Y2 n.X.Y 3 4 3 9 12 27 48 36 3 5 5 15 25 45 125 75 5 5 12 60 60 300 300 300 6 6 4 24 24 144 144 144 6 7 5 30 35 180 245 210 6 8 3 18 24 108 192 144 7 7 6 42 42 294 294 294 8 8 2 16 16 128 128 128 40 214 238 1226 1476 1331 a) Recta de regresión de Y sobre X. X Y= = = =214 40 5 35 238 40 5 95' ' ( )( ) ( ) 71'0 3244 2308 2141226.40 238.2141331.40 . ; ' ' ' ' ' . ' e) Calcule e interprete el coeficiente de determinación. Sus valores no tienen porqué coincidir con el del coeficiente de correlación de Pearson, si bien verifican las mismas propiedades que éste. ( 33 3 == − = ∑ s N xxn As Ligeramente asimétrica a la derecha (o positiva) c) x d x x z x x s = = − = − = = − = = 2 2 1975 0 025 0 025 15164 0 016 ' ' ' ' ' Nº Suspensos Alumnos 0 16 1 20 2 14 3 15 4 10 5 5 Estadística descriptiva (F. Álvarez) - 31 18 Haciendo uso de coeficientes basados en medidas de posición, estudie la asimetría y el apuntamiento de la distribución. ( ). x 3º.- En puntuaciones tipificadas: zy' = r .zx zy' = 0'9861 .zx b) Proporción de varianza residual : Cuando se habla de proporción siempre se refiere al cociente entre la varianza total de Y; es decir, a la proporción de varianza de Y que representa la varianza solicitada. FRECUENCIA ABSOLUTA (n) : Para datos no agrupados en intervalos, es el número de veces que se presenta cada valor de la variable. b) Sabiendo que un alumno ha aprobado, ¿ cuál es la probabilidad de que haya elegido el problema A ?. ... 222 == − − = − − = ∑∑ ∑∑∑ XXN YXYXN b a Y b X= − = − =. ' . En esta página … [16,18) 21 Desviación media. == ++ == ∑ N xn x ii Media geométrica : 077'2223948822394882239488 3.2.1...... 05'020 120 20 7103 21 21 ==== === N nn nn G nxxxx Media armónica : 935'1 333'10 20 3 7 2 10 1 3 20 == ++ = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = ∑ i i A x n Nx x n 1 3 2 10 3 7 20 36 - Estadística descriptiva (F. Álvarez) 23 El estudio de las faltas de asistencia a clase de alumnos de un grupo de 3º de Secundaria produjo los resultados siguientes : Faltas 1 2 3 4 5 6 7 8 Alumno s 4 3 3 2 3 2 1 2 Determine la mediala y estudie analítica y gráficamente el grado de concentración de la distribución. Si comparamos mediante las varianzas : X S X SA A B B= = = − = = = = − = 792 40 19 8 18798 40 19 8 77 91 489 30 16 3 9867 30 16 3 63212 2 2 2' ; ' ' ; ' ; ' ' el grupo A presenta una mayor variabilidad. ' . ' . ' 15 pertenece al intervalo [13,16) : P k kk = + − = ⇒ =13 40 100 8 11 3 15 3833% . WebDe manera inmediata se podrá solicitar al estudiantado psico–sociales que ocurren en que describa por medio de gráficos lo que comprendió por cambios bio–psico–sociales, y que lo niños y niñas con la edad, con ejemplifique de manera personal realizando la actividad que se encuentra en la página 85, esto descripciones y contrastación permitirá que la clase cuente … 0 c d El coeficiente de correlación ϕ toma el valor : ( )( )( )( )dbcadcba bcad ++++ − = ... ϕ Coeficiente de correlación biserial puntual rbp : El siguiente procedimiento se puede utilizar cuando una variable es continua y la otra dicotómica. ( ). ' En efecto coinciden los coeficientes de correlación obtenidos por los dos métodos. En primer … Edades Nº de trab. A mayor puntuación en la prueba Y menor nivel en X. En ella se incorpora la columna x , que contiene la marca de clase (valor central) de cada intervalo. DIAGRAMAS DE SECTORES : Resultan de la división de un círculo en sectores cuya amplitud es proporcional a la frecuencia. . x n 2752 36 2754 54 2756 24 2758 18 4 Una serie familias se han clasificado por su número de hijos, resultando : Nº de hijos 0 1 2 3 4 5 6 7 8 Nº de familias 11 13 20 25 14 10 4 2 1 Se pide: a) Calcular la tabla completa de frecuencias. x1).x1 N1=n1 P1 = (N1 / N) . FASES 2, 3 Y 4 DEL TRABAJO GRUPAL: • Introducción: Los objetivos a lograr en este trabajo son: - Aplicar los conocimientos teóricos adquiridos en clase. . . ' Dicha relación es positiva (directa); es decir, alumnos con altas calificaciones en Matemáticas se corresponden con altas calificaciones en Lengua, y a la inversa. ... ' Con los momentos calculados : Media µ = = =x a1 17083' Varianza σ2 2 2 08734= = =s mx ' Coeficiente de asimetría ( ) ( ) As m m = = =3 2 3 3 0 2468 08734 0 3024 ' ' ' Coeficiente de curtosis K m m = − = − =4 2 2 23 2 2954 08734 3 0 0091 ' ' ' Estadística descriptiva (F. Álvarez) - 41 28 La tabla muestra la comprensión lectora (X) de dos grupos de sujetos educados en niveles socioculturales altos (A) y bajos (B). a) Inicio x 4 5 1 5 2 3 2 1 1 3 27 x2 16 25 1 25 4 9 4 1 1 9 95 x sx= = = − = 27 10 2 7 95 10 2 7 14872' ; ' ' Ordenando valores : 1 1 1 2 2 3 3 4 5 5 Mediana = 2’5 Moda = 1 Final y 6 8 5 9 3 6 7 6 4 9 63 y2 36 64 25 81 9 36 49 36 16 81 433 y sy= = = − = 63 10 6 3 433 10 6 3 192' ; ' ' Ordenando valores : 3 4 5 6 6 6 7 8 9 9 Mediana = 6 Moda = 6 b) Mejora d 2 3 4 4 1 3 5 5 3 6 36 d2 4 9 16 16 1 9 25 25 9 36 150 d sd= = = − = 36 10 3 6 150 10 3 6 14282' ; ' ' Media de la diferencia : d y x= − = − =6 3 2 7 36' ' ' ( No es válido para dispersiones ) 28 - Estadística descriptiva (F. Álvarez) 15 a) Determine la media, desviación típica, coeficiente de variación, mediana y moda del número de suspensos. 16 La puntuación estimada de la variable Y para un valor 0 de la variable X es 0’5454, siendo la varianza de esta variable 16’5. de los alumnos de un curso. Y c) Coeficiente de correlación : Utilizando la expresión ( )( ) 9648'00207'2.4607'0'. Estadística 1 TRABAJO PRÁCTICO N°1: ESTADÍSTICA DESCRIPTIVA EJERCICIO 1: Las puntuaciones de una prueba de inteligencia aplicada a 75 alumnos de un curso han sido: 87 105 … La ordenada f(z) : sX la desviación típica de X (considerados sus valores globalmente). Es decir : r = + =0 7042 0 8392' ' De la recta de regresión de Y sobre X deducimos (para las medias) : Y Y X X Y' ' ' ' '= = + ⇒ = − = − =1 2 1 2 5 2 1 2 4 La desviación típica de X la podemos obtener ahora de la relación : r b s s s r s b sX Y X Y X= ⇒ = = = ⇒ = =. Cuando es un número manejable de datos, usualmente 20 o menos, y hay pocos datos diferentes, se pueden tratar como no agrupados y extraer información valiosa de ellos. TIPIFICACIÓN. - Altura de las personas. 'A B3 1 3 3 30 1 3 12 30 1 3 18 30 1 3 3 30 3 33 0 0909= + + = = 11 Disponemos de tres urnas con la distribución de bolas blancas y rojas indicada en el gráfico de la izquierda. . Al ser nulos los coeficientes de regresión, a coincidirá con la media de Y y a' con la de X. b) Recta de regresión de Y sobre X : b s s s a Y b XXY X X = = = = − = − =2 2 0 0 1 5 0 3 1 5. ' . De igual modo puede establecerse la curva de regresión de la media de X condicionada a Y. Así, por ejemplo, la figura muestra los pares siguientes: X=1 : (1,1) , (1,3) sustituidos por el par (1,2) , al ser 2 la media de 1 y 3. . . ' Pr( ) Pr( ) Pr( )A A A1 2 3 30 90 1 3 = = = = Pr( / ) Pr( / ) Pr( / )B A B A B A1 2 3 12 30 18 30 3 30 = = = La probabilidad pedida es : Pr( / ) . . xi).xi NI=n1+n2+ ... +ni Pi = (Ni / N) . . ' ' . '1 1078 2 4045 0 5486 0 9648 no se planteará tal dificultad. En este cuadro, fA significa frecuencia con alto prejuicio y fB frecuencia con bajo. X Y.∑ = 1.2.1 + 5.2.2 + 9.4.1 = 58 Utilicemos las medias y varianzas de X e Y, así como la covarianza, en los cálculos solicitados. Cálculo del percentil . . 6 D DMe x= = 870 7 Se dividen por dos. . El coeficiente de correlación entre X e Y es 0’977, y la varianza de la variable X es 16’5. válido para … Compare los resultados obtenidos en los apartados a), b) con los de los apartados c), d). zy b) 1 - r2 = 0'1667 10 y' = 1'5 . Ordenando las primeras (X), calculamos sus diferencias con las segundas : X Y d d2 1 4 -3 9 2 1 1 1 3 3 0 0 4 6 -2 4 5 2 3 9 6 5 1 1 24 Con ello : ( ) ( )ρ = − − = − − = ∑ 1 6 1 1 6 24 6 6 1 0 3143 2 2 2 . Nosotros, principalmente, utilizaremos dos: • Editor de datos. '= + + + + + = =6 11 3 11 6 11 2 11 3 11 6 11 3 11 2 11 2 11 6 11 2 11 3 11 72 121 0 595 4 - Probabilidad (F. Álvarez) b) Pr . Media aritmética : x x N i= = + + + + = = ∑ 5 1 5 4 8 5 23 5 4 6' Media geométrica : x x x xG NN= = = = = =1 2 5 5 1 5 0 25154 8 800 800 800 3807. . . Un fabricante de medicamentos veterinarios está interesado en la proporción de animales que … Es la media de las desviaciones o separaciones de cada una de las observaciones, respecto a la media aritmética, consideradas en valor absoluto. 18 - Regresión y correlación (F. Álvarez) La recta de regresión es : en puntuaciones directas : Y' = -0'4 + 0'8 . TABLA DE FRECUENCIAS ABSOLUTAS. 0’75 + 0’20 . ( ) . .= −1 2 IMPORTANTE : Observe los diferentes significados e interpretaciones de r2. 1.2.- ENTORNO DE TRABAJO Existen diversos tipos de ventanas en SPSS. 5. Así, si todos los valores son muy altos, podremos restarles una cantidad (normalmente la Moda) y, si poseen cifras decimales o son múltiplos de un mismo número, podremos multiplicarlos o dividirlos por el valor adecuado. EJERCICIOS DE ESTADISTICA DESCRIPTIVA EN MINITAB. 22 2 2 =−=−= ∑ x N an iiσ Desviación típica σ = =4 4622 2 1124' ' Moda en [16,18) Mo = + + =16 4 4 19 2 16 3478. ' Todo depende del número de cifras decimales que emplee en sus cálculos. . . ' POLÍGONO DE FRECUENCIAS : Obtenido enlazando los puntos medios de los extremos superiores de las franjas. . Y c) La recta de regresión de Y sobre X en puntuaciones típicas es : z r z z zY X Y X' '. ' 1 Los pesos de los empleados de una fábrica vienen dados por la siguiente tabla: a) Construir la tabla de … Ejemplo 1: Segn la Asociacin de lucha contra la Bulimia y la Anorexia, las pautas culturales han determinado que la delgadez sea … . . ' 22 2 2 =−=−= ∑ x N xn s iix s sx x= = = 2 2 005 1 416' ' MODA = Valor de mayor frecuencia = 3 PERCENTILES Para la determinación de medidas de posición (percentiles), podemos seguir dos procedimientos de cálculo : 1º) Basado en las frecuencias absolutas acumuladas N : Determinamos el lugar que ocupa : L = k.N / 100 El percentil será el valor cuya frecuencia N primero iguale o supere al lugar L. 2º) Basado en porcentajes acumulados P : El percentil será el valor cuyo porcentaje P primero iguale o supere al orden k del percentil. Un estudiante de la Facultad de Ciencias Administrativas ha sacado las siguientes calificaciones en la asignatura de estadística descriptiva: 14 en el examen parcial del 1er hemisemestre que … c) Calcular la media, mediana y moda. Regresión y correlación (F. Álvarez) - 5 Coeficiente de correlación τ (tau) de Kendall : Como el de rangos de Spearman, este coeficiente es aplicable cuando las dos variables son ordinales (reordenaciones de una serie de elementos). Por ello se intenta definir las medidas de dispersión, de modo que sean el promedio de las separaciones de cada valor respecto de uno tomado como referencia (la MEDIA). ( ) ' ' ' ' ' ' ' 1 10 5 2 2 5 0 4 016 1 016 016 016 0 1 1 0 64 2 1 0 6 2 08 0 2 2 2 La solución es 0’8 al indicar que hay más varones que mujeres. evolución del pensamiento filosófico, cual es el departamento de tacna, maestrías para ingenieros industriales en colombia, mejor película animada oscar 2021, 10 ejemplos de desigualdad de género en el trabajo, convocatoria de choferes para el poder judicial 2022, mi mantenimiento escolar 2022, listado de productos que requieren registro sanitario digemid 2022, factura negociable interbank, relaciones estequiométricas calculadora, exámenes preoperatorios precio, modelo de demanda de cambio de nombre y apellidos, terremoto de yungay 1970 pdf, prácticas pre profesionales cusco, colegio internado en lima, modelo de solicitud de devolución de dinero perú, semana económica suscripción, universidad europea de madrid, como citar un artículo en apa ejemplo, idc malla curricular diseño de modas, se puede colocar asfalto sobre concreto, petición de herencia sentencia, laudato si contaminación, emociones en el joven adulto, juegos para la cena de navidad, cetpro peruano japonés, 5 nombres de empresas comerciales, proyectos de departamentos en cusco, mapa de las áreas naturales del perú, examen de certificación osce pago, programa de higiene y saneamiento ppt, modelo de contrato privado de ejecución de obra perú, que es la inseguridad ciudadana, noticias sociales de colombia 2022 hoy, sigead sistema de gestión administrativa, examen de admisión uncp 2022 ii, vitamina b12 sublingual 5000 mcg para que sirve, beverly hills polo club zapatos, venta de perros pincher miniatura en arequipa, la entrevista de guayaquil para niños, renipress actualización, 5 platos típicos de sullana, cicatriz umbilical invertida, convocatoria minagri 2022, desinfección terminal y concurrente, como hacer tamales de choclo, fiesta patronal de bambamarca 2022, curso de extensión universitaria bcrp 2023, fisiología de la contractura muscular, full day santa rosa de quives, estados unidos y son los dos países más contaminantes, proyecto aeropuerto internacional de chinchero cusco, villamedic libro enam, cepre unalm aula virtual, características de la economía ecológica, venezolanos matan a familia en colombia, que faja es buena para el dolor de espalda, horarios de misa en el santísimo sacramento, donde estudiar ciencias del deporte en lima, machu picchu expedition, tottus televisores smart tv, ux writing curso buenos aires, resumen del evangelio de juan pdf, tiendas de artículos chinos, semiología medica y tecnica exploratoria, dirección del banco interamericano de desarrollo, régimen de admisión temporal, alambre galvanizado delgado, vulnerabilidades de documentos, ventajas de un negocio informal, 10 cosas que no debes hacer en internet, misión de una municipalidad distrital, constancia de egresado posgrado unac, segunda especialidad odontología ucsm 2022, el primer horizonte cultural, lenguajes del amor y sus significados, cevicheria delivery villa el salvador,

Distritos De La Provincia De Huancavelica, Importancia Del Sistema De Abastecimiento, Valores De Una Municipalidad Distrital, Clínica San Juan Bautista App, Presupuesto Carpeta Asfaltica, Comunicación Audiovisual Upc Costo, Guías De Función Inversa, Minera Aruntani Donde Queda, Bosque Andino Patagónico Problemas Ambientales, Descargar Test Prolec-r, Momento Polar De Inercia De Un Rectángulo, Radio Felicidad En Vivo Lima,

trabajos de estadística descriptiva resueltos