martes, 27 de abril de 2010

REGRESION LINEAL SIMPLE

a mREGRESION LINEAL SIMPLE

I. ANTECEDENTES

En muchos problemas hay dos o más variables relacionada y el interés se centra en modelar y explorar esa relación. El modelo de regresión es un modelo matemático que caracteriza la relación existente entre una variable denominada dependiente (Y) y otra variable denominada independiente o explicativa (X) a través de una recta, que toma el nombre de recta de regresión.
En los modelos empíricos, los modelos de regresión son una buena base para obtener resultados cuantitativos al realizar un experimento, ya que son fáciles de comprender, interpretar e implementar.

La razón por la que se pueden elegir los métodos de regresión es debido a que estos se utilizan para el análisis de los datos de los experimentos no planeados, y oro factor a tomar en cuenta es el costo que genera realizar pruebas.

II. USOS DE RLS
Las situaciones prácticas en que es importante investigar la naturaleza de la relación entre dos variables pertenecen a todos los aspectos del quehacer humano. Por ejemplo, los administradores de sistemas universitarios están interesados en evaluar la relación entre las calificaciones obtenidas por los aspirantes en los exámenes de admisión y las calificaciones que aquellos obtienen como alumnos. Para un agrónomo es muy importante la relación entre el número de plantas por hectárea en un cultivo y el rendimiento de este. La dependencia entre las cantidades gastadas en la publicidad de un producto y las ventas del mismo es preocupación fundamental de los gerentes de venta. La Asociación entre el peso y la presión arterial de una persona es importante en medicina. Con los ejemplos se muestra el amplio espacio de aplicación que tiene el análisis de regresión.

III. SUPOSICIONES BÁSICAS

Las suposiciones del Modelo de Regresión Lineal Simple son:







d) Independencia
Los valores de Y deberán ser estadísticamente independientes.

e) Normalidad
La distribución de Y para cualquier valor de X es Normal. Esto equivale a suponer que la variable aleatoria no observable E es normal, ya que X se toma como una variable no aleatoria susceptible de ser manipulada por el investigador.

IV. MODELO DE RLS
El Modelo de Regresión Lineal Simple es el siguiente



Estimación de la recta de regresión por mínimos cuadrados

Para estimar B0 y B1 se utiliza el Método de Mínimos Cuadrados, que consiste en encontrar aquellos valores de B0 y B1 que hagan mínima la suma de los cuadrados de las desviaciones de las observaciones respecto de la recta que representa el modelo, en el sentido vertical, de tal forma que la recta estimada será:











Interpretación de la ecuación de regresión






















Análisis de la varianza de la regresión




Coeficiente de correlación

Se define el coeficiente de correlación como:



El coeficiente toma valores en el intervalo [-1, 1], que proporciona una idea de hasta qué punto el ajuste lineal es razonable:
• Si r es próximo a -1: el ajuste es aceptablemente bueno, distribuyéndose las observaciones (xi, yi) alrededor de una recta de pendiente negativa.
• Si r es próximo a 0: el ajuste no es aceptable, indicando que no existe relación lineal entre las variables.
• Si r es próximo a +1: el ajuste es aceptablemente bueno, distribuyéndose las observaciones (xi, yi) alrededor de una recta de pendiente positiva.

Coeficiente de determinación
Se define el coeficiente de determinación, R2, como el cuadrado del coeficiente de correlación entre los valores de Y observados y los valores de Y ajustados. Sin embargo se puede demostrar que es igual a la siguiente expresión:

El rango de R2 es entre 0, cero ajuste, hasta 1, ajuste perfecto (cuando los puntos aparecen en un línea recta).

V. EJEMPLO APLICADO A CIENCIAS FORESTALES

Origen y análisis de los datos: Se tienen datos de volumen y área basal de 22 árboles de la especie Lisyloma latisiliquum (tzalam), los cuales se ingresaron al programa estadístico SAS® Versión 9.0, de la siguiente forma:



Modelo ajustado: De acuerdo a los resultados



El modelo ajustado es:
VOLUMEN = 0.09756 + (3.43650*AREA BASAL)

Prueba de hipótesis:
Probar la siguiente hipótesis (significancia de la variable AREA BASAL sobre el VOLUMEN:

Ho: β1 = 0 y Ha: β1 ≠ 0
En base a t:
tc= β1 / S β1 tc = 3.4365 /0.35438 tc = 9.697
t n-2,α/2 = 2.086 ; tc>t por lo tanto Se rechaza Ho

Intervalos de confianza al 95% de β0 y β1


Coeficiente de determinación
R2= 0.8246


VI. BIBLIOGRAFÍA
Infante G. S., G. P. Zarate L. 1990. Métodos estadísticos: un enfoque interdisciplinario. Editorial Trillas. México, D.F. p. 463-524.

VII. WEBGRAFÍA

http://www.monografias.com/trabajos27/regresion-simple/regresion-simple.shtml
http://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal
http://www.mitecnologico.com/Main/RegresionLinealSimple
http://e-stadistica.bio.ucm.es/mod_regresion/regresion_2.html
http://74.125.155.132/search?q=cache:v-EnoQiFBh8J:www.mty.itesm.mx/egap/materias/re-4004/Cap3.ppt+regresion+lineal+simple&cd=10&hl=es&ct=clnk&gl=mx




COLEGIO DE POSTGRADUADOS
CAMPUS MONTECILLO

Introducción a la Estadística
Seminario de Plataformas educativas


Dr. Jose Antonio Santizo Rincón
Dr. José Luis García Cue
Roy Jabín Carreón Santos