
https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado17
Análisis de experimentos factoriales para la investigación
agronómica mediante Infostat
Referencia
López Bautista, E. A. y González Ramírez, B. H. (2024). Análisis de experimentos factoriales para la investigación agronómica
mediante Infostat. Revista Científica del Sistema de Estudios de Postgrado. 7(2). 17-30.
DOI: https://doi.org/10.36958/sep.v7i2.299
Analysis of factorial experiments for agronomical reseach using Infostat
Ezequiel Abraham López Bautista
Profesor titular de la Facultad de Agronomía
Universidad de San Carlos de Guatemala
ealbautis@gmail.com
https://orcid.org/0000-0002-4724-4251
Resumen
OBJETIVO: mostrar a los investigadores el análisis estadístico de un experimento bifactorial empleando
software. MÉTODO: en la descripción, se emplean datos de rendimiento de avena, cultivada en tres fechas
de siembra y cuatro niveles de nitrógeno, en un diseño de bloques completos al azar y arreglo combinatorio.
Se realizó el análisis de la varianza (ANOVA), verificación de los supuestos, gráfico de las interacciones y
análisis post ANOVA; empleando el software Infostat v.2020®. Para la verificación de los supuestos del modelo
estadístico fue empleada la prueba de Shapiro-Wilk (para verificar la normalidad) y el gráfico de dispersión
entre valores predichos y los residuos estudentizados (para verificar la homocedasticidad y la independencia).
Como prueba post ANOVA se empleó la comparación de medias DGC. RESULTADOS: la tabla resumen del
ANOVA para un experimento bifactorial fue generada en el Infostat v.2020® junto con el valor del coeficiente
de variación (CV) como indicador de precisión del experimento. Los factores principales y la interacción fueron
significativos. Los p valores asociados a las fechas, niveles de nitrógeno, e interacción fueron de <0.0001,
0.0034 y 0.0325 respectivamente. El CV fue de 24.67%, con intervalo de confianza, generado por simulación de
Recibido: 05/02/2024
Aceptado: 26/09/2024
Publicado: 26/11/2024
Artículo científico
Byron Humberto González Ramírez
Profesor titular y Director del Centro de Telemática
(CETE) de la Facultad de Agronomía
Universidad de San Carlos de Guatemala
byrong.gt@gmail.com
https://orcid.org/0000-0002-2787-9508
Las opiniones expresadas en el artículo son responsabilidad exclusiva de los autores y no necesariamente representan la posición oficial de
la USAC y sus miembros. La obra está protegida por la Ley de Derechos de Autor y Derechos Conexos emitida en el decreto No. 33-98 por
el Congreso de la República de Guatemala.

https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado18
Abstract
OBJECTIVE: to show researchers the statistical analysis of a two-factor experiment using software. METHOD:
In the description, oat yield data are used, grown on three sowing dates and four nitrogen levels, in a randomized
complete block design and combinatorial arrangement.The analysis of variance (ANOVA), verification of
assumptions, interaction graph and post-ANOVA analysis were performed; using the Infostat v.2020® software.
To verify the assumptions of the statistical model, the Shapiro-Wilk test was used (to verify normality) and the
scatter graph between predicted values and studentized residuals (to verify homoscedasticity and independence).
The DGC comparison of means was used as a post-ANOVA test. RESULTS: The summary table of the ANOVA
for a two-factor experiment was generated in Infostat v.2020® along with the coefficient of variation (CV) value
as an indicator of the precision of the experiment. The main factors and the interaction were significant. The p
values associated with the dates, nitrogen levels, and interaction were <0.0001, 0.0034, and 0.0325. The CV
was 24.67%, with a confidence interval generated by simulation of 22.27-27.07%. In the review of assumptions,
these were met. According to the DGC test, the best yields were obtained on the first sowing date, and when
nitrogen was applied, generating a quadratic model. CONCLUSION: The use of software allows for easy, fast,
and reliable analysis. It is also possible to have more time for the interpretation of the ANOVA results.
Keywords
factorial experiment, statistical software, analysis of variance, mean difference test, polynomial regression
Palabras clave
experimentos factoriales,
software estadístico, análisis de la varianza, prueba de comparación de medias,
estadística experimental
22.27-27.07%. En la revisión de supuestos, estos fueron cumplidos. De acuerdo con la prueba DGC, los mejores
rendimientos fueron obtenidos en la primera fecha de siembra y, cuando se aplicó nitrógeno, generándose un
modelo cuadrático. CONCLUSIÓN: El uso de
software permite realizar el análisis de manera fácil, rápida y
confiable. También es posible disponer de más tiempo para la interpretación de los resultados del ANOVA.

https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado19
Introducción
Los experimentos factoriales poseen dos o más factores, lo más común es emplear dos o tres
como máximo, cada uno con distintos niveles posibles, debido a la complejidad de interpretación
de las interacciones (Martínez, 1988). Todas las factibles combinaciones de los niveles de los
factores (considerados de efectos cruzados) se ubican en las unidades experimentales.
Una investigación de este tipo permite al investigador estudiar el efecto principal de cada
factor, así como los efectos de las interacciones entre ellos sobre la variable dependiente o de
respuesta. Es posible clasificar estos ensayos como simétricos, como el caso de un experimento
factorial 32, donde se tienen dos factores cada uno con tres niveles. El experimento factorial
tendría nueve combinaciones o tratamientos en total. También los experimentos se clasifican
como asimétricos, como el caso de un factorial 3 x 4 (Martínez, 1988). En ambos casos,
las interacciones entre los factores son regularmente las más significativas y representan el
objetivo central de los investigadores.
Los experimentos factoriales fueron utilizados en el siglo XIX por John Bennet Lawes y
Joseph Henry Gilbert de la Estación Experimental Rothamsted, Londres, Inglaterra (Yates &
Mather, 1963). Fisher (1926) argumentó que los experimentos «complejos» como los ensayos
factoriales eran más eficientes que estudiar un factor a la vez.
Oehlert (2000) y Montgomery (2013) citaron que dentro de las ventajas de los experimentos
factoriales en comparación con los simples, se tiene el ahorro de recursos y lo más importante,
el análisis de las interacciones, como una mejor aproximación a lo que sucede en la naturaleza.
Como inconvenientes, se tiene que al incrementar el número de niveles y/o factores, crece
demasiado el número de interacciones, con algunas de poco interés práctico. Además, se
demanda de mayor área experimental, que ocasiona problemas de manejo del ensayo.
El desarrollo de
software en esta era de globalización, ha acentuado nuevos modos de
transformación del conocimiento en la educación y el campo laboral (Parmar et al., 2022). Las
herramientas computacionales, principalmente las de acceso libre o construidas con base
en éstas para fines educativos, han abierto oportunidades para los centros de enseñanza e
investigación en países en desarrollo, en términos de proporcionar acceso al análisis de datos
confiable y a bajo costo.
En este contexto, el uso de
software como Infostat® (Di Rienzo et al., 2020), ampliamente
utilizado en América Latina para el análisis de datos experimentales, y también empleado
en la Facultad de Agronomía de la Universidad de San Carlos de Guatemala (FAUSAC)
desde el año 2002, ayuda al usuario final a inferir los resultados de una manera simple y
ordenada para tomar decisiones rápidas. Así, el docente dispondrá de más tiempo para
discutir la interpretación de los resultados. Este escrito será de utilidad para que estudiantes
e investigadores conozcan el análisis de experimentos factoriales para la investigación
agronómica utilizando
software estadístico.

https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado20
Objetivo
Mostrar a los docentes, estudiantes e investigadores del área agronómica, el análisis
estadístico de un experimento bifactorial dispuesto en un diseño de bloques completos al
azar y arreglo combinatorio, empleando Infostat ® v. 2020
Materiales y métodos
Infostat® es un
software distribuido bajo licencia, que también dispone de una versión
estudiantil, sin costo alguno. Fue creado bajo el soporte del entorno de programación R,
con fines educativos. Esto hace que su uso sea inmediato en la versión libre y su costo sea
accesible cuando se adquiere mediante licencia por estudiantes, docentes o investigadores.
Para realizar el análisis de datos, el usuario necesita importar un conjunto de datos ordenado
y depurado en una hoja de cálculo electrónica de
Excel.
Para ilustrar el uso de Infostat® fueron empleados los datos citados por Parmar et al. (2022),
referentes a un experimento bifactorial sobre rendimiento de granos de avena (Avena sativa),
con arreglo combinatorio dispuesto en un diseño de bloques completos al azar (con seis
repeticiones). Los factores evaluados fueron fechas de siembra (FS1, FS2 y FS3) y cuatro
niveles de nitrógeno (NO, N1, N2 y N3), para un total de 12 combinaciones (tratamientos). El
conjunto de datos obtenido al realizar el ensayo, referente a la producción de grano de avena
(expresada en arrobas por unidad experimental) se presenta en la tabla 1:
Tabla 1Distribución de los rendimientos de granos de avena por tratamiento, fecha de siembra,
niveles de nitrógeno y bloques.
Nota: tomado de Parmar et al. (2022)

https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado21
El procedimiento para analizar los datos en Infostat® se detalla a continuación:
• Preparar el conjunto de datos para su exportación desde
Excel a Infostat. Los datos están
disponibles en este enlace http://cete.fausac.gt/wp-content/uploads/2024/09/factoriales.xlsx
• Importar los datos a Infostat, al ubicar en el menú principal, la opción «edición” y luego
presionar en: «Pegar con nombres de columnas» (brindar atención a copiar desde
Excel
el nombre de las columnas y los datos).
• Construir el gráfico de las interacciones, mediante el uso del gráfico de puntos, ubicado
en el menú «gráficos». En «Criterios de clasificación (optativa)» coloque los niveles del
factor nitrógeno (N), en variables a graficar VR y en «Particiones» las fechas de siembra
(FS). Aparecerá un recuadro como en la figura 1 (es necesario marcar en «medidas de
confianza»: Ninguna y activar «Particiones en el mismo gráfico» (Balzarini et al., 2008).
Figura 1Diagrama de puntos
• Posteriormente se realiza el ANOVA, con un nivel de significancia del 5%. En el menú
«Estadísticas» seleccionar «Análisis de la Varianza» y especificar los términos del modelo
tal como se muestra en la figura 2:
https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado22
Figura 2Especificación de los términos del modelo estadístico-matemático
Agregar la interacción FS*N y marcar los residuos, predichos y residuos estudentizados,
que servirán para realizar el análisis de los residuos del modelo estadístico matemático para
verificar su cumplimiento.
El modelo estadístico-matemático utilizado es el siguiente (Montgomery, 2013):
Con:
i = 1, 2, 3 fechas de siembra
j = 1,2,3,4 niveles de nitrógeno
k =1,2,3,4,5,6 bloques

https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado23
Siendo:
ijkY
μ
i
α
j
β
( )ij
αβ
k
γ
ijk
ε
=rendimiento de granos de avena medidos en la ijk-ésima unidad experimental
=media general del rendimiento de grano de avena
=efecto de la i-ésima fecha de siembra de la avena
=efecto del j-ésimo nivel de nitrógeno
=efecto de la interacción entre la i-ésima fecha de siembra y el j-ésimo nivel de nitrógeno
=efecto del k-ésimo bloque o repetición
=error experimental asociado a la ijk-ésima unidad experimental
• Para la verificación de los supuestos del modelo fueron aplicados los siguientes
procedimientos.
• Como análisis posterior al ANOVA fue aplicada la prueba de comparación de medias de
Di Rienzo, Guzmán y Casanoves identificada como DGC (Di Rienzo et al., 2002), que
está basada en el análisis multivariado de conglomerados (Cluster analysis), tal como se
muestra en la figura 3.
Normalidad de los residuos: fue evaluada la hipótesis nula Ho: siguen una distribución
normal con media 0 y varianza 1. Para ello, fue empleada la prueba de Shapiro-Wilk
modificada (Di Rienzo et al., 2020).
Homocedasticidad (igualdad de varianzas) e independencia de los residuos. En este caso
fue construido un gráfico de dispersión, considerando en el eje X a los valores predichos
por el modelo y en el eje Y a los residuos estudentizados (RE).
Los valores de estos últimos están comprendidos entre los límites de -3 y 3, que de acuerdo
con el teorema de Tchebyshev, concentran aproximadamente el 99% de los datos. Fuera
de estos límites, cualquier par graficado se considera como atípico (outlier) o extremo.
https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado24
Figura 3Especificación de la prueba de DGC en Infostat
Para el análisis de polinomios ortogonales fue ajustado un modelo polinomial de grado 2
(cuadrático), considerando como variable independiente los niveles crecientes de nitrógeno
y como variable dependiente el rendimiento de grano de avena, para cada fecha de siembra.
Resultados y discusión
En la tabla 2 se presenta el resumen del ANOVA con un 5% de significancia, proporcionado
por el Infostat, así mismo los valores de coeficiente de variación (CV= 24.67%) y el coeficiente
de determinación (R2 = 78%).

https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado25
Tabla 2Resumen del análisis de la varianza para la variable rendimiento de granos de avena
De acuerdo con el ANOVA, hubo efecto significativo (valores de p < 0.05) de los factores
principales. Se identifica la fecha de siembra con la mayor significancia. Le siguen los
niveles crecientes de nitrógeno. Además, hubo efecto de la interacción, que en los
experimentos factoriales, es el principal interés. Respecto al CV = 24.67% está considerado
como aceptable para experimentos agronómicos realizados en campo abierto. El valor de
R2 = 78% indica que el 78% de la variabilidad total del rendimiento de granos de avena se
explica por la parte fija del modelo estadístico (factores, interacciones y bloques) y el 22%
debido al azar.
Para analizar las interacciones de manera más detallada fue construida la figura 4. En ella,
se confirma que el efecto de la interacción es significativo, debido a que las líneas no son
paralelas. Además, se observa que el nivel fecha de siembra 1 presenta los valores más altos
de rendimiento promedio de grano de avena. Se alcanza su máximo, cuando es aplicado el
nivel 2 de nitrógeno. Por otra parte, con la fecha de siembra 1 se presentan los rendimientos
promedio más bajos.
https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado26
Figura 4Gráfico de las interacciones entre la fecha de siembra y los niveles de nitrógeno
Respecto al cumplimiento de los supuestos del modelo estadístico del experimento, la prueba
de Shapiro-Wilk proporcionó un valor de p = 0.0539. Se concluye que los residuos siguen la
distribución normal.
En la figura 5 se presentan el gráfico de dispersión para verificar la homocedasticidad y la
independencia de los residuos. Se observa que la nube de puntos presenta un comportamiento
aleatorio (sin alguna tendencia definida). De esta forma, se concluye que las varianzas son
homogéneas (se cumple el supuesto de homocedasticidad) y además son independientes (o
sea, que no están correlacionados). Esto es importante, para darle validez a los resultados
experimentales.
https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado27
Figura 5Gráfico de dispersión de residuos
Finalmente, se presenta la tabla 3 con el resumen de la prueba de comparación de medias de
DGC, de donde se concluye que con la fecha 1 de siembra se tienen los mejores resultados
de rendimiento promedio, con los niveles de nitrógeno N1, N2 y N3, superior al NO (sin
aplicación de nitrógeno).
https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado28
Tabla 3Resumen del análisis de la prueba de comparación de medias de DGC
Conclusión
El uso de Infostat v. 2020® permitió realizar los análisis estadísticos de datos experimentales
de manera fácil, rápida y confiable. Derivado de ello, se dispone de más tiempo para
la interpretación y discusión de los resultados con los usuarios. Además, hace posible la
verificación de los supuestos del modelo y generar gráficas de alta calidad.
Referencias
Balzarini, M., González, L., Tablada, M., Casanoves, F., Di Rienzo, J., & Robledo, C. (2008).
Infostat. Manual del Usuario. Editorial Brujas.
https://repositorio.catie.ac.cr/bitstream/handle/11554/10346/Manual_INFOSTAT_2008.pdf
Di Rienzo, J., Cassanoves, F., Balzarini, M., González, L., Tablada, M., & Robledo, C. (2020).
Infostat (Versión 2020) [Software]. Centro de Transferencia InfoStat.
http://www.infostat.com.ar

https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado29
Di Rienzo, J., Guzmán, A., & Casanoves, F. (2002). A Multiple-Comparisons Method Based
on the Distribution of the Root Node Distance of a Binary Tree.
Journal of Agricultural,
Biological, and Environmental Statistics, 7(2), 129–142. JSTOR. https://www.jstor.org/
stable/1400690
Fisher, R. (1926). The arrangement of field experiments. 33, 503–515.
https://digital.library.adelaide.edu.au/dspace/bitstream/2440/15191/1/48.pdf
Oehlert, G. (2000). A First Course in Design and Analysis of Experiments. W. H. Freeman and
Company. https://www.semanticscholar.org/paper/A-first-course-in-design-and-analysis-
of-Oehlert/34703d23bd4283965894c3ce92d5ce5e1e397ac0
Parmar, R. S., Kathiriya, D. R., & Kamani, G. J. (2022). Analysis of factorial experiments for
agricultural reseach using digital tools.
Gujarat Journal of Extension Education, 33(1), 150–
154. https://doi.org/10.56572/gjoee.2022.33.1.0030
Yates, F., & Mather, K. (1963). Ronald Aylmer Fisher, 1890-1962. Biographical Memoirs of
Fellows of the Royal Society, 9, 91–129. https://doi.org/10.1098/rsbm.1963.0006
Sobre los autores
Ezequiel Abraham López Bautista
Es Ingeniero Agrónomo. Doctor en Ciencias. Profesor titular de la Sub área de Métodos de
Cuantificación e investigación de la Facultad de Agronomía, USAC.
Byron Humberto González Ramírez
Es Ingeniero Agrónomo. Ph. D., Profesor titular y Director del Centro de Telemática (CETE) de
la Facultad de Agronomía, USAC.
Financiamiento de la investigación
Con recursos propios.

https://revistasep.usac.edu.gt
Coordinadora General del Sistema de Estudios de Postgrado30
Declaración de intereses
Declaramos no tener conflicto alguno de intereses, que influyeran en los resultados obtenidos
o las interpretaciones propuestas.
Declaración de consentimiento informado
El estudio se realizó respetando el Código de ética y buenas prácticas editoriales de publicación.
Derecho de uso
Copyright (c) (2024) Ezequiel Abraham López Bautista y Byron Humberto González Ramírez.
Este texto está protegido por la Licencia Creative Commons Atribución 4.0 Internacional
Este texto está protegido por una licencia
Creative Commons 4.0.
Es libre para compartir, copiar y redistribuir el material en cualquier medio o formato y adaptar
el documento, remezclar, transformar y crear a partir del material para cualquier propósito,
incluso comercialmente, siempre que cumpla la condición de atribución: debe reconocer él
crédito de una obra de manera adecuada, proporcionar un enlace a la licencia, e indicar si se
han realizado cambios. Puede hacerlo en cualquier forma razonable, pero no de forma tal que
sugiera que tiene el apoyo del licenciante o lo recibe por el uso que hace.