- Introducción
- Análisis de Regresión Lineal
Simple - Aspectos
metodológicos - Análisis y evaluación del
método - Conclusión
- Referencias
bibliográficas - Anexos
Introducción
El diplomado en Estadística Aplicada a las
Ciencias Sociales con el propósito de actualizar los
conocimientos del talento humano en la generación,
gestión y análisis de estadísticas sociales,
económicas, administrativas y salud, entre otras, en la
planificación y toma de decisiones en la gestión
pública y privada; donde el uso de herramientas y
técnicas de estadística exige una formación
especializada de funcionarios, profesionales y personas de las
diferentes ramas del saber que tengan que ver con el manejo,
análisis y desarrollo de informes.
La estadística se ha convertido en un
método efectivo para describir con exactitud los valores
de los datos económicos, políticos, sociales,
psicológicos, biológicos y físicos, y sirve
como herramienta para relacionar y analizar dichos datos. El
trabajo del experto estadístico no consiste ya sólo
en reunir y tabular los datos, sino sobre todo el proceso de
interpretación de esa información.
De allí surge de la importancia y necesidad que
tiene el uso de la Estadística en cualquier área
del conocimiento, particularmente se expone lo que concierne a
las Ciencias Sociales como una herramienta para la
obtención y el análisis de datos, mediante
características y métodos propios de esta
área de la Matemática.
Por lo antes expuesto, el objetivo del presente trabajo,
consistió en poner en práctica los conocimientos
adquiridos en el Diplomado de Estadística Aplicada a las
Ciencias Sociales, a través de la formulación de
aplicaciones prácticas con datos cuantitativos, cuyo
objetivo fue estimar la producción de arroz en
Venezuela.
DESARROLLO
Análisis
de Regresión Lineal Simple
El objetivo principal del análisis de
regresión es estimar el valor de una variable aleatoria
(la variable dependiente) dado que se conoce el valor de una
variable asociada (la variable independiente),
La ecuación lineal que representa al modelo de
regresión líneal simple (Kasmier, 2006)
es:
Aspectos
metodológicos
Aplicación para el desarrollo de estimaciones
de variables dependientes. 1) Caso Análisis de
Regresión Lineal Simple
En ésta investigación se utiliza la
Regresión Lineal para la estimación de la
producción de arroz en Venezuela; requiriéndose
determinar si la superficie cosechada de arroz influye
significativamente en la producción de dicho cultivo y
finalmente determinar la bondad del ajuste del modelo y verificar
sus supuestos.
Por otra parte, la población está
conformada por los valores de producción y superficie
cosechada en Venezuela desde 1997 al 2013; donde la muestra
corresponde a dichos valores de producción y superficie
cosechada desde el año 1997 al 2013. Los datos fueron
obtenidos a través de la página de
internet:http://www.fedeagro.org/
Los datos fueron representados en cuadros y
gráficos (figuras) para hacer un análisis de estos,
que permite elaborar conclusiones y obtener resultados
estadísticos como base para dar las recomendaciones
necesarias; con la ayuda de los softwares estadísticos
SPSS, InfoStat y hoja de cálculo Excel.En primer lugar un
análisis univariante en donde se presentan las medidas
descriptivas para cada variable y luego laestimación de la
recta de regresióncon uso de la técnica de
análisis de regresión lineal con mínimos
cuadrados y finalmente el coeficiente de determinación,que
es el estadístico que mide la proporción de la
variación total en Y que puede ser "explicada" por la
variación en X.
En este caso la variable dependiente es
producción de arroz y la independiente la superficie
cosechada de arroz.
El modelo que se espera obtener es el
siguiente:
En el Cuadro 1 se presenta la data seleccionada de dos
variables en arroz Producción y superficie cosechada de 17
años (1977 al 2013).
Cuadro 1. Producción (kg) y
superficie cosechada (ha) de arroz en Venezuela desde 1997 al
2013
Fuente: Fedeagro, 2014.
Análisis y
evaluación del método
Aplicación para el desarrollo de estimaciones
de variables dependientes. Caso Análisis de
Regresión Lineal
En los Cuadro 2.1 y 2.2 se muestra la estadística
descriptiva de cada una de las variables bajo estudio
(Producción y superficie cosechada de arroz).
Análisis de la variable
dependiente
La producción mínima de arroz en Venezuela
es 668.164 kg, la cual ocurrió en el año 2002;
mientras que la producción máxima de arroz es de
1.360.650 kg, que fue la del año 2008. Así mismo la
producción promedio de arroz en el país es de
más o menos 889.622,88 kg (Cuadro 2.1). También el
25% de la producción está por debajo de 720.193 kg;
el 50% está por debajo de 821.070 kg y el 75% está
por debajo de 1.005.000 kg. La variabilidad en las observaciones
correspondiente a la producción de arroz es de
aproximadamente 50.181,440 kg (Cuadro 2.2). Por otra parte, en el
histograma (Figura 1) se observa que la distribución de
los datos es platicúrtica, es decir, existe poca
concentración de datos en la parte central de la
distribución, esto seconfirma con el coeficiente de
curtosis calculado, siendo menor a 0. Con respecto a la
asimetría, se observa en el histograma que existen pocos
datos alrededor del valor máximo, lo que indica
asimetría positiva, esto se confirma con el coeficiente
calculado, siendo mayor a 0;sin embargo, en el gráfico de
caja no se observan datos atípicos(Figuras 2.1 y
2.2).
Figura 1. Histograma de producción
de arroz con SPSS
Figura 2.1. Diagrama de cajas de la
variable producción de maíz con SPSS
Figura 2.2. Diagrama de cajas de la
variable producción de maíz con InfoStat
Análisis de la variable
independiente
La superficie mínima cosechada de arroz en
Venezuela es de 134.294 ha, la cual ocurrió en el
año 2002; mientras que la superficie máxima
cosechada de arroz fue de 263.738 ha, que fue la del año
2009. Así mismo la superficie promedio de arroz en el
país es de más o menos 186.334,00 ha (Cuadro 2.1).
También el 25% de la superficie está por debajo de
151.875 ha; el 50% está por debajo de 172.952 ha y el 75%
está por debajo de 215.979 ha. La variabilidad en las
observaciones correspondiente a la superficie cosechada de arroz
fue de aproximadamente 10.419,155 ha (Cuadro 2.2). Por otro lado,
en el histograma (Figura 3) se observa que la distribución
de los datos es platicúrtica, es decir, existe poca
concentración de datos en la parte central de la
distribución, esto se confirma con el coeficiente de
curtosis calculado, siendo menor a 0. Con respecto a la
asimetría, se observa en el histograma que existen pocos
datos alrededor del valor máximo, lo que indica
asimetría positiva, esto se confirma con el coeficiente
calculado, siendo mayor a 0; sin embargo, en el gráfico de
caja no se observan datos atípicos (Figuras 4.1 y
4.2).
Figura 3. Histograma de superficie
cosechada de arroz con SPSS
Figura 4.1. Diagrama de cajas de la
variable producción de arroz con SPSS
Figura 4.2. Diagrama de cajas de la
variable superficie cosechada de arroz con Fuente: InfoStat,
2014. Versión Estudiantil
Diagrama de dispersión
Es una gráfica en la cual cada punto representa
un par de valores observados de las variables independiente y
dependiente. El valor de la variable independiente X se grafica
en el eje horizontal, y el valor de la variable dependiente Y se
grafica en el eje vertical (Kasmier, 2006); es decir es la
primera forma de describir una distribución bidimensional
al representar los pares de valores en el plano cartesiano,
recibiendo el nombre de nube de puntos o diagrama de
dispersión. En la Figuras: 5.1, 5.2 y 5.3; se muestra la
tendencia que indica una relación lineal directa entre las
variables producción y superficie cosechada de
maíz, para lo cual se procedió a calcular el
coeficiente de correlación de Pearson, resultando de
0,951; el cual es positivo y altamente significativo (Cuadro 3),
lo que puede considerarse una correlación
excelente.
Figura 5.1. Diagrama de dispersión
con Excel
Figura 5.2. Diagrama de dispersión
con Excel con SPSS
Figura 5.3. Diagrama de dispersión
con InfoStat
Cuadro 3. Coeficiente de correlación
de Pearson para producción y superficie cosechada de
arroz
Fuente: IBM SPSS Statistics 20
Regresión Lineal Simple.
Estimación:
En la Figura 6, se ilustrael gráfico y
ecuación de regresión en Excel. Expresando los
resultados en términos de la recta de regresión, se
tiene:
Y = 10628 + 0,1975
X
Figura 6. Gráfico y
ecuación de regresión en Excel
Se puede señalar, que por cada hectárea
cosechada, la producción aumenta en 0,1975 kilos; mientras
que el coeficiente "b0" indica el valor promedio de la
producción de arroz cuando no varía la superficie
cosechada (aproximadamente 10.628 kg). Es decir, con ésta
ecuación de regresión, se usa para estimar la
producción de arroz. El coeficiente de
determinación (R2) es un valor de 0,9049. Esto significa
que la variación en la superficie cosechada explica el
90,49 % de la variación de la producción anual de
arroz en Venezuela. El resultado del análisis de
regresión a través del programa SPSS, se puede
observar en los Cuadros: 4, 5 y 6; donde la ecuación es
exactamente la misma, antes indicada, aunque en la
constante:ß0 (Cuadro 6) el valor de t resultó no
significativo, mientras que para superficie si resultó
altamente significativo.
El análisis de la varianza (ANOVA) para
regresión resultó altamente significativo (Cuadro
5) y el coeficiente ß1 es altamente significativo (Cuadro
6).
Detección de violaciones de
supuestos del modelo. Revisión del modelo
Luego de que se ha estimado un modelo de
regresión se debe estudiar si el mismo es el adecuado; por
lo que corresponde probar si los supuestos, sobre los que se
sustenta el modelo, son aceptables. Es decir, que los errores son
independientes, normalmente distribuidos con media cero y
varianza constante?, ¿serálineal el modelo? Los
residuos darán pautas para decidir si rechaza o no se
rechaza estas hipótesis.
Normalidad
Cómo se observa en la figura 7, donde el Q-Q plot
fue realizado con los residuos del modelo de regresión y
usando como distribución teórica la Normal: los
puntos se disponen en una recta a 45º indicando que el
supuesto distribucional para los residuos se cumple, lo que se
comprueba con la Prueba de Shapiro-Wilks (modificado), cuyas
hipótesis:
Ho: Los errores siguen una distribución
normal
H1. Los errores no siguen una distribución
normal
Homocedasticidad
De acuerdo a la Figura 8, los residuos muestran
tendencia de ser homocedásticos
Figura 8. Residuos
Conclusión
De acuerdo a los resultados del análisis de
regresión lineal, la producción de arroz en
Venezuela ha sido estimada mediante un modelo bastante bueno.
Cabe destacar que también concuerda con las relaciones
funcionales esperadas entre la variable explicativa y la variable
dependiente.Asimismo, no se viola ninguno de los supuestos del
análisis de regresión lineal.
Referencias
bibliográficas
Di Rienzo J.A., Casanoves F., Balzarini M.G., Gonzalez
L., Tablada M., Robledo C.W. InfoStat versión 2014. Grupo
InfoStat, FCA, Universidad Nacional de Córdoba, Argentina.
URL http://www.infostat.com.ar
Fedeagro. 2014. Estadísticas Agrícolas.
In. http://www.fedeagro.org/
Guilarte, A. y Marín C. (2014). Regresión
y Correlación. 19 p.
Kasmier L. 2006. Estadística Aplicada a
Administración y Economía. Cuarta edición.
McGraw-Hill editores. México. 406 p.
Anexos
ANEXO 1. EVALUACIÓN DIRECTA DE
CALIDAD CULINARIA DE FRIJOL (Vignasinensis (L.)
Walp)
FECHA: _________________
LUGAR: __________________
NOMBRE DEL EVALUADOR:
______________________________________________
PROCEDENCIA DEL EVALUADOR:
___________________________________________
CARGO DEL EVALUADOR (Agricultor,
técnico, estudiante, ama de casa, otro):
________________________________
¿Cuál frijol te gusto
más y por qué?
____________________________________
|
Autor:
Gelis T. Torrealba N.
Universidad Central de Venezuela
Facultad de Agronomía
Coordinación de
Extensión
Diplomado en Estadística Aplicada a
las Ciencias Sociales
Maracay, diciembre del 2014