La tendencia actual a la hora de clasificar contenido esta evolucionando de forma que se está sustituyendo la típica clasificación en categorías por etiquetas (o tags como es más conocido). Pero, ¿realmente suponen una ventaja? ¿Qué ganamos y qué perdemos al usar tags?
Bien, en mi opinión, la principal ventaja que tienen los tags sobre las categorías es que no son excluyentes, es decir, un artículo por ejemplo puede tener varios tags en vez de pertenecer a una única categoría, por lo tanto es mucho más fácil de clasificar al no tener la necesidad de ceñirse a un solo concepto. Pero... realmente sabemos clasificar la información usando tags, ¿Para quién usamos los tags, para un buscador o para un ser humano?
Otro punto a favor de los tags, es que no es el administrador del sistema el que decide los tags, sino los propios usuarios. Esto es útil principalmente en sistemas a los que acceden muchos usuarios e intercambian información. No obstante esto presenta un arma de doble filo ya que aunque el significado semántico de dos tags pueda ser el mismo, los ordenadores trabajan con sintaxis, con cadenas de caracteres y por tanto les sería difícil relacionar tag con etiqueta o ordenador con computadora.
Una característica que perdemos con los tags, es la jerarquización, por ejemplo, si clasificamos a algo como un perro, con un sistema de categorías sabríamos también que es un animal, cosa que no ocurre con los tags.
A la hora de buscar información, esta claro que si sabemos lo que buscamos, los tags pueden ser más útiles, pero ¿Y si no lo sabemos? ¿Y si solo queremos navegar por la información? En este caso los tags son como una nube de información que puede llegar a ser demasiado amplia y dificultarnos la tarea, mientras que las categorías, nos permiten ir especializando la búsqueda progresivamente.
¿Entonces, donde está la revolución de los tags? ¿Quien se beneficia del uso de tags? La respuesta es: Google(o cualquier otro buscador), y por extensión los usuarios del buscador.
Entonces, ¿Cuando usar tags? En mi opinión, los tags son útiles cuando se necesita clasificar grandes cantidades de información altamente heterogénea, en cambio, cuando se trata de información relacionada, creo que las categorías son mucho más útiles.
Nuestra visión del mundo online
Has mencionado lo de la búsqueda sintáctica. Sé que es un tema muy debatido, y tal, pero ESA es la principal limitación de Internet en cuanto a la difusión de la información se refiere.
ResponderEliminarSi buscas un concepto, tienes que dar con la palabra exacta que lo define en un texto en concreto... y para eso es necesario tener mucha suerte.
Bueno pero tanto los tags como las categorias estan pensados un poco para subsanar eso (o intentarlo), yo puedo escribir un texto y luego poner en los tags palabras que no aparezcan en ese texto precisamente para reflejar el contenido semántico del mismo.
ResponderEliminarYo programé para mi blog un sistema de categorías jerárquicas no excluyentes. Es decir, un sistema de etiqutetado en el que las etiquetas eran a la vez nodos de un árbol.
ResponderEliminarVarias cosillas:
ResponderEliminarSara, la búsqueda que interesa no es la "sintáctica", sino la "semántica". De ahí eso de la web semántica y todo eso de lo que mucha gente habla pero nadie sabe realmente qué es (le preguntaré algún día a alguno de mis colegas que trabajan en ello).
La inclusión de etiquetas en un fragmento de información, esto es, la clasificación, puede ayudar enórmemente a la búsqueda de resultados. De hecho, el primer trabajo en clasificación automática de documentos (de 1961) llamaba a la clasificación documental un "método de indexación automática para documentos". Esto quiere decir que la propia información de la clase servía para buscar sobre esa información, y para contextualizar resultados.
Sobre lo que dice Other, a raíz del post de Iván, tiene razón. De hecho, el problema de la clasificación jerárquica (clases dentro de una jerarquía) es independiente del de etiquetar con varias clases cada texto. De hecho, en cualquier sistema de clasificación jerárquica por materias (aquellos que usan, por ejemplo en el tesáuro médico MeSH), se suelen clasificar los artículos en más de una clase de zonas diferentes del árbol. Simplificando bastante, son dos problemas distintos:
- Si devuelvo una lista de clases, cuándo tengo que "cortar" (qué clases son tan poco relevantes para mi documento que ya no merece la pena que las incluya).
- Si estoy en una rama del árbol, ¿cuál es la clase que más me interesa? ¿Tengo que mostrar una sóla y ocultar las relacionadas de la misma rama? (Este problema es más difícil que el anterior).
Y por último, el uso de etiquetas y no clases es bueno por dos motivos:
- El conjunto de clases no es estático (ver por ejemplo, del.icio.us, donde se pueden añadir etiquetas que no estuvieran predeterminadas).
- Las clases (etiquetas) las asigna un humano (normalmente) y no una máquina, por lo que puede clasificar semánticamente un documento (y también, por desgracia, subjetivamente).
Sí, obviamente, me interesa mucho este tema :).