Repository logo
  • Institutions
  • Estadísticas
  • Log In
    New user? Click here to register. Have you forgotten your password?
  1. Home
  2. Browse by Author

Browsing by Author "Amón Uribe, Iván"

Now showing 1 - 1 of 1
Results Per Page
Sort Options
    Items seleccionados: 0
  • Detección de duplicados: una guía metodológica

    Institución: Universidad Autónoma de Bucaramanga

    Revista: Revista Colombiana de Computación

    Autores: Amón Uribe, Iván; Jiménez, Claudia

    Fecha de publicación en la Revista: 2010-12-01

    Fecha de cosecha en Ciencia Nacional: 2024-07-08

    Cuando una misma entidad del mundo real se almacena más de una vez, a través de una o varias bases de datos, en tuplas con igual estructura pero sin un identificador único y éstas presentan diferencias en sus valores, se presenta el fenómeno conocido como detección de duplicados. Para esta tarea, se han desarrollado múltiples funciones de similitud las cuales detectan las cadenas de texto que son similaresmas no idénticas. En este artículo se propone una guía metodológica para seleccionar entre nueve de estas funciones de similitud (Levenshtein, Brecha Afín, Smith-Waterman, Jaro, Jaro-Winkler, Bi-grams, Tri-grams, Monge-Elkan y SoftTF-IDF) la más adecuada para un caso específico o situación particular, de acuerdo con la naturaleza de los datos que se estén analizando.
Consorcio ColombiaConsortia
Acerca de Ciencia Nacional