Minería de Texto y Minería web de los Perfiles y Publicaciones de una Afiliación en Google Scholar para procesamiento estadístico de textos.
Extraer los datos del perfil de GS de la Universidad Tecnológica de Panamá (UTP) para medir el factor de impacto de sus publicaciones a través del índice H de cada Investigador y la cantidad de citaciones de los perfiles de las Revistas UTP en GS.
Para obtener los datos de GS se desea extraer la información de un sitio web utilizando “Web Scraping” o “Raspado de páginas web”, para ello evaluaremos diferentes métodos de Web Scraping para extraer datos de los perfiles y Publicaciones de Googles Scholar. A través de estos métodos queremos realizar una comparación de extracción de datos y desarrollar e implementar un Algoritmo para extraer todos los datos de los perfiles, publicaciones por Afiliación, de una forma más rápida, eficiente y estructurada, tomando en cuenta de que actualmente no existe un paquete que pueda extraer estos datos en GS, queremos comparar con otros métodos de Web Scraping y la velocidad de extracción de datos de 15 diferentes perfiles de Universidades.
Investigadores
- Danny Murillo - Investigador Principal (IP)
- Dalys Johana Saavedra Villarreal - Co-Investigador (Co-IP)