Entradas aleatorias

Javascript barra de lectura

javascript

Nuestra visión del mundo online

19 de enero de 2007

Tags vs Categorías

4 comentarios

  1. Has mencionado lo de la búsqueda sintáctica. Sé que es un tema muy debatido, y tal, pero ESA es la principal limitación de Internet en cuanto a la difusión de la información se refiere.
    Si buscas un concepto, tienes que dar con la palabra exacta que lo define en un texto en concreto... y para eso es necesario tener mucha suerte.

    ResponderEliminar
  2. Bueno pero tanto los tags como las categorias estan pensados un poco para subsanar eso (o intentarlo), yo puedo escribir un texto y luego poner en los tags palabras que no aparezcan en ese texto precisamente para reflejar el contenido semántico del mismo.

    ResponderEliminar
  3. Yo programé para mi blog un sistema de categorías jerárquicas no excluyentes. Es decir, un sistema de etiqutetado en el que las etiquetas eran a la vez nodos de un árbol.

    ResponderEliminar
  4. Varias cosillas:

    Sara, la búsqueda que interesa no es la "sintáctica", sino la "semántica". De ahí eso de la web semántica y todo eso de lo que mucha gente habla pero nadie sabe realmente qué es (le preguntaré algún día a alguno de mis colegas que trabajan en ello).

    La inclusión de etiquetas en un fragmento de información, esto es, la clasificación, puede ayudar enórmemente a la búsqueda de resultados. De hecho, el primer trabajo en clasificación automática de documentos (de 1961) llamaba a la clasificación documental un "método de indexación automática para documentos". Esto quiere decir que la propia información de la clase servía para buscar sobre esa información, y para contextualizar resultados.

    Sobre lo que dice Other, a raíz del post de Iván, tiene razón. De hecho, el problema de la clasificación jerárquica (clases dentro de una jerarquía) es independiente del de etiquetar con varias clases cada texto. De hecho, en cualquier sistema de clasificación jerárquica por materias (aquellos que usan, por ejemplo en el tesáuro médico MeSH), se suelen clasificar los artículos en más de una clase de zonas diferentes del árbol. Simplificando bastante, son dos problemas distintos:
    - Si devuelvo una lista de clases, cuándo tengo que "cortar" (qué clases son tan poco relevantes para mi documento que ya no merece la pena que las incluya).
    - Si estoy en una rama del árbol, ¿cuál es la clase que más me interesa? ¿Tengo que mostrar una sóla y ocultar las relacionadas de la misma rama? (Este problema es más difícil que el anterior).

    Y por último, el uso de etiquetas y no clases es bueno por dos motivos:
    - El conjunto de clases no es estático (ver por ejemplo, del.icio.us, donde se pueden añadir etiquetas que no estuvieran predeterminadas).
    - Las clases (etiquetas) las asigna un humano (normalmente) y no una máquina, por lo que puede clasificar semánticamente un documento (y también, por desgracia, subjetivamente).

    Sí, obviamente, me interesa mucho este tema :).

    ResponderEliminar

También
te puede interesar