Inicio/Metodologías

Metodologías

Recolección y procesamiento
de información

Esta página explica, de manera técnica y transparente, cómo se recolecta, procesa y verifica la información presentada en la plataforma. Nuestro objetivo es ofrecer transparencia total sobre los métodos utilizados durante el desarrollo y la obtención de datos.

Alcance

¿Qué cubren estas metodologías?

Explicamos cómo se obtienen los datos de partidos y candidatos, cómo se procesan con modelos de IA y cuáles son las limitaciones y controles de calidad que aplicamos.

Principios

  • Automatización para reducir sesgos humanos.
  • Uso responsable de modelos de IA.
  • Fuentes públicas y verificables.
  • Claridad sobre limitaciones y alcances.
1. Información general

¿Cómo recolectamos la información general?

La información relacionada con partidos políticos y candidatos se recopila a partir de noticieros, fuentes públicas y listas oficiales difundidas durante el último semestre de 2025.

Para garantizar consistencia y minimizar intervención humana, utilizamos programas automatizados que:

  1. Realizan búsquedas periódicas en fuentes públicas.
  2. Extraen la información relevante de manera automática.
  3. Procesan los datos iniciales.
  4. Insertan esa información directamente en nuestra base de datos.

Este proceso asegura que la información general se mantenga actualizada, organizada y libre de sesgos manuales.

Flujo resumido

  • 1

    Búsqueda automatizada

    Bots consultan periódicamente fuentes públicas y listas oficiales.

  • 2

    Extracción y filtrado

    Se seleccionan solo los datos relevantes para la plataforma.

  • 3

    Normalización

    Se limpian y estructuran los datos antes de almacenarlos.

  • 4

    Carga a la base de datos

    La información queda lista para ser mostrada en la aplicación.

2. Perfiles individuales

¿Cómo recolectamos la información de cada candidato?

El procedimiento es similar al de la información general, pero más detallado y segmentado por tipo de dato:

  1. Un programa automatizado realiza búsquedas específicas para cada categoría de información (por ejemplo, biografía, polémicas, trayectoria, etc.).
  2. Se recopilan múltiples fuentes confiables que contengan datos sobre el candidato (por ejemplo, Wikipedia u otros portales informativos; excluyendo redes sociales).
  3. Una vez reunidas las fuentes, se genera una distribución equilibrada del contenido para evitar que una sola fuente domine la información.
  4. Todo este contenido es procesado por un LLM (modelo de lenguaje de gran tamaño), el cual:
    • Organiza la información.
    • Extrae los puntos más relevantes.
    • Genera los textos finales para cada categoría del perfil.
    • Guarda los links de donde se obtuvo la información.

El LLM no crea información nueva: solo sintetiza y organiza los datos provenientes de las fuentes recopiladas automáticamente.

3. Diagrama del proceso: Recolección de información de candidatos

Este flujo ilustra cómo combinamos automatización, múltiples fuentes y modelos de lenguaje para construir los perfiles.

Diagrama de recolección de información de candidatos
4. Análisis de sentimiento

¿Cómo realizamos el análisis de sentimiento público?

El análisis de sentimiento es uno de los procesos más complejos. Para ello:

  1. Se recopilan comentarios exclusivamente de Twitter y Reddit, publicados únicamente durante la última semana para cada candidato.
  2. Los comentarios se clasifican según su tono: positivo, neutral o negativo.
  3. Para este análisis utilizamos un modelo de transformers llamado AutoModelForSequenceClassification, desarrollado por terceros (no por nuestro equipo).
  4. Este modelo determina automáticamente el sentimiento de cada comentario.
  5. Finalmente, todos los resultados se procesan con un LLM, cuya única función es:
    • Resumir tendencias.
    • Describir el tono general del público hacia el candidato.
    • Generar un resumen final claro para presentar en la aplicación.

Rol del LLM

El LLM no modifica el resultado del modelo de clasificación:

  • No cambia etiquetas positivas, neutrales o negativas.
  • No corrige ni ajusta los scores del modelo base.
  • Solo genera una narrativa legible sobre las tendencias.

En otras palabras, actúa como un intérprete de resultados, no como un juez adicional.

5. Diagrama del proceso: Análisis de sentimiento

Del comentario en redes sociales al resumen de percepción pública que ves en la plataforma.

Diagrama de análisis de sentimiento
Limitaciones y control

Lo que sí hacemos, lo que no hacemos

Es importante entender qué tan lejos llegan nuestros modelos y procesos automatizados, y cuáles son sus límites.

7. Limitaciones de las fuentes de información

Toda la información utilizada por esta plataforma proviene de fuentes públicas disponibles en internet. Sin embargo, no todos los candidatos o partidos cuentan con presencia pública suficiente o información ampliamente documentada.

Por esta razón, es posible que algunos perfiles aparezcan incompletos o vacíos. La ausencia de información en un perfil no implica ninguna valoración, sino simplemente una limitación en la disponibilidad de datos públicos.

8. Verificación manual y control de calidad

Aunque gran parte del proceso está automatizado, aplicamos una verificación manual en los siguientes casos:

  • Información que parece inconsistente o contradictoria.
  • Señales de posibles errores generados por modelos de IA.
  • Reportes enviados por los usuarios.
  • Solicitudes de corrección por parte de candidatos o partidos.

Este proceso busca mantener la plataforma precisa, neutral y transparente. Cualquier solicitud enviada será verificada; de lo contrario, no podrá incorporarse a la plataforma.

9. Limitaciones del análisis automatizado

El análisis de sentimiento y los resúmenes generados por modelos de inteligencia artificial:

  • No representan hechos objetivos.
  • Reflejan únicamente tendencias generales en comentarios públicos.
  • No constituyen asesoramiento político ni recomendaciones de voto.

Esta plataforma no busca influir en la opinión pública, sino ofrecer herramientas informativas de forma neutral.