TY - THES TI - Modelo de procesamiento de lenguaje natural para detectar la tasa de éxito de un artículo sobre otro. PB - Universidad Icesi PY - 2021 UR - http://repository.icesi.edu.co/biblioteca_digital/handle/10906/89008 AB - Muchas personas comparten actualmente noticias, enlaces o videos a familiares y amigos, sin ser conscientes del impacto que pueden tener en las decisiones o forma de actuar de las personas. Un ejemplo claro, que recientemente se ha vivido en Colombia, corresponde al paro nacional que está sucediendo al momento de la entrega de esta tesis. Los colombianos han vivido como las noticias inducen a las masas a tomar decisiones que afectan el ambiente político social y económico del país. También se ha visto como las noticias pueden llegar a generar miedo en el pueblo, o incluso, a desinformarlo en el caso de las noticias falsas. Por estas razones resulta muy importante determinar el impacto que puede tener una noticia. El problema planteado radica en la inexistencia de una manera de predecir el impacto que puede tener una noticia para una comunidad de usuarios. Por lo tanto, el objetivo consiste en implementar un modelo de aprendizaje automático que permita predecir, con la mejor fidelidad posible, la viralidad de artículos en línea. Para esto se utilizó una metodología enfocada a proyectos de aprendizaje automático denominada CRISP-DM. Dado que este proyecto fue una propuesta de investigadores en Barcelona, la forma en que se valida este trabajo es mediante una encuesta donde se comprueban los objetivos, hallazgos y resultados alcanzados, versus lo que ellos esperaban. Finalmente, se obtuvo como mejor resultado aquel correspondiente al modelo donde el núcleo de la arquitectura se basaba en un modelo pre entrenado, denominado BERT, el cual permitía predecir, para una pareja de títulos de noticias, si el primer título sería más viral que el segundo. KW - Lenguaje natural KW - Aprendizaje automático KW - Modelos de aprendizaje KW - Aprendizaje profundo KW - Inteligencia artificial KW - Redes neuronales KW - Procesamiento de la información KW - Procesamiento del lenguaje KW - Análisis de la información KW - Information analysis KW - Information processing KW - Registro de la información KW - Information recording KW - Artículos científicos KW - Scientific articles KW - Aprendizaje automático (Inteligencia artificial) KW - Machine learning KW - Tésis KW - Ingenierías KW - Departamento Tecnologías de Información y Comunicaciones ER -