Últimas actualizaciones: semántica RSS

  • “El viento rozando…” o como monté un experimento semántico 

    Enrique Castro 5:43 am on 21 April 2009 Permalink | Responder
    Etiquetas: meta, pagerank, posicionamiento, , semántica, tags

    El avatar de este blog

    El avatar de este blog

    La idea de esta entrada es hacer una primera valoración semántica de esta herramienta de comunicación personal  y cómo ha sido su evolución. (Más …)

     
  • Breves apuntes sobre la web semántica 

    Enrique Castro 8:06 pm on 16 November 2008 Permalink | Responder
    Etiquetas: buscadores, Google, , page rank, paradígma, , RSS, semántica, , usuarias, usuarios, ,

    Como dije en el pasado, posiblemente el año 2009 será el que abrirá las puertas a lo que se conoce de forma teórica como web semántica.

    Aunque mucha gente no le preste la suficiente y debída atención, la web semántica, formulará nuevas relaciones de visibilidad y por lo tanto de poder en la Net. La relevancia de Google cambiará ( con el nacimiento de un nuevo buscador semántico o con el cambio del popular algorítmo secreto del gigante buscador) generando unos nuevos estándares de navegabilidad, generación de contenidos orientados a textos específicos o especializados o en su defecto, la creación de nuevas herramientas de busqueda más personalizadas o personalizables por los/as usuarios/as.

    Imágen de la W3C

    Imagen de la W3C

    Por lo tanto, teniendo en cuenta todas las precauciones y cautelas por mi parte, creo que la Web de contenidos semánticos nos podrán proporcionar condiciones de búsqueda completamente revolucionarias. Por poner varios ejemplos:

    • Exactitud en los contenidos de las busquedas, basadas en relaciones textuales y no en la relevancia algorítmica.
    • Multiplicidad de resultados ordenados por su orden cronológico y por la “conversación” establecida.
    • Personalización de los resultados y de los buscadores, pensados en el usuario o la usuaria. Los buscadores serán herramientas remotas, construidas por los/as internautas.

    Para terminar me parecen muy claras las intenciones de Google, si tenemos en cuenta las declaraciones de uno de sus fundadores, Larry Page, en la entrega de los Premios Príncipe de Asturias:

    Google puede que sepa más que cualquier persona en todo el mundo pero no necesariamente lo entiende, así que nuestro objetivo principal es dotar de esa inteligencia a los ordenadores.

     
  • Penalizaciones 

    Enrique Castro 12:22 pm on 1 November 2008 Permalink | Responder
    Etiquetas: agregadores, , , , , , , , semántica, , ,

    Las herramientas SEO es una de las obsesiones de este nuevo Internet que muy posiblemente se convertirá en viejo a partir del 2009, con la celebración del Congreso W3C que tendrá lugar en Madrid.

    El otro día leí una excelente entrada “Técnicas Penalizables de Javier Casares” (buscarlo en el Google) que indica las cosas que no se deben hacer en materia de posicionamiento SEO. Particularmente hay una que me llama muchísimo la atención:

    “5.5. Contenido Duplicado

    En general en el mundo de la informática se tiende a no duplicar o hacer dos veces una misma tarea. Los buscadores también intentan no tener dos veces un mismo texto o contenido, ya que no aporta nada a la calidad de resultados.

    Esto significa que sitios que generan sus contenidos gracias a contenidos de otros sitios no tienen aportación a los motores y pueden llegar a ser considerados sitios duplicados.

    Un detalle a tener en cuenta sobretodo son los feeds (RSS – Atom) que permiten ofrecer contenido a terceros de una forma sencilla y que estos otros sitios la acaben incorporando entre sus contenidos. En estos casos deberás intentar filtrar que estos sitios no roben los contenidos para uso propio.”

    (que es lo que acabo de hacer de forma parcial, pero para no perjudicar no apunto al contenido a través de hipervínculos o hipertexto)

    Pues en estos días que tanto se habla de Periodismo Digital en Cáceres creo que hay cuestiones que no se han abordado. Vamos a ver un ejemplo práctico:

    Vayan a Google y pongan:

    “Los símbolos franquistas se retirarán de los edificios propiedad del Estado”

    Vean los resultados… Un copiar y pegar de las agencias, en los primeros 4 resultados. Pues bien, la existencia de un contenido de forma duplicada penaliza. Podrán pensar… “pero sale en los cuatro primeros resultados”. Cierto, pero la búsqueda en este caso es sintáctica.

    Vayamos a la búsqueda semántica (que no lo es, por que Google no es semántico). Vayan a Google y pongan:

    “Símbolos franquistas”

    ¿Cómo cambia la cosa…verdad? ( También pueden hacer este pequeño ejercicio en algunos de los primeros experimentos de buscadores semánticos -buscar en Google- que hoy están en funcionamiento y verán que los resultados son claramente dispares)

    Entre los/as bloggers existe una práctica muy extendida de copiar y pegar contenido de los demás, o incluso de uno/a mismo/a, publicando contenidos duplicados a través de aplicaciones web basadas en código XHTML o XML ( Aprovechando la fuente RSS o feed) pensando que así se consigue un mejor y mayor posicionamiento. Nada más lejos de la realidad.  ¿Por qué no funciona?

    Por término medio los agregadores de blogs están programados en PHP con código XML, pero tienen una carencia muy importante, siendo la misma la ausencia de una base de datos que “ordene” o “archive” el contenido como própio, generando “metatags” o “etiquetas” que le den o confieran un sentído “sintáctico” a las mismas, amén de que diferencien el contenido “agregado” o “sindicado” del original.

    A esta ausencia de metatags en el código fuente de los agregadores, normalmente generan potencia de posicionamiento las “fuentes” de su agregación (Nombres de los/as autores o participantes de la agregación) pero no sus temas, texto…conocimiento que aportan.

    Además de que la cultura del rankismo en la blogocosa ha favorecido la popularización de herramientas de “notoriedad” que para nada aportan posicionamiento. Alguno/a me dirá…”pero si visibilidad”…y yo le contestaría, pues si…pero solamente para los/as frikis de este fenómeno (los/as generadores de contenidos o influenciadores)

    ¿Cómo solucionar todo esto? Generando agregadores inteligentes, desarrollados en códigos de programación como por ejemplo Ruby on Rails, con CMS de gestión que permitan además de indexar de forma automática los contenidos a través de fuentes RSS, generar bases de datos de los mismos (histórico), ordenando dichos contenidos con “metatags” própios y administrados para diferenciar los originales. Google premia la intervención humana y no los procesos automatizados (característica de funcionamiento de los webspam muy arraigados por la industria del posicionamiento o domainers)

    Ejemplo de programación (para la captura):

    </script>

    <script type=“text/javascript”>

    var pageTracker = _gat._getTracker(“UA-1876445-2″);

    pageTracker._initData();

    pageTracker._trackPageview();

    Y para la indexación de metatags:

    <span class="entry-meta">

    Conclusiones: amén de que no hay nada decidido, pero todo parece apuntar a que la web semántica será el estándar del futuro, el copiar y pegar contenidos en la web será y seguirá siendo un recurso (al margen de aspectos culturales o de debate) negativo, el principal caballo de batalla de cualquier webmaster, programador o administrador de contenidos de una web que quiera obtener visitas y por lo tanto poder.

    Nota de aclaración o Disclaimer: en mi antiguo blog no hablaba de todas estas cosas por diferentes razones, la fundamental por que al tocar un nicho de comunicación muy competitivo (política)  amén de absurdo, se tenía y se tiene la mala costumbre de copiar y pegar ideas. La programación de un site en la Net supone un trabajo árduo y muy duro, amén de poco remunerado y peor reconocido. La idea de “compartir conocimiento” sería válida siempre y cuando los recursos económicos para desarrollarlas fueran compartidas. Pero en la Sociedad Digital al igual que en la analógica, EL DINERO NO SE COMPARTE.

    Nota de actualización: acabo de moderar un comentario (lo envié a la cola del spam)  que en forma de trackback ha llegado al Akismet de WordPress. Se trata de un blog captura etiquetas (en este caso PHP) que lo único que hace es capturar fuentes RSS con determinadas etiquetas, para que su “cita” salga publicada en este blog y por lo tanto ganar cierto posicionamiento en Google, al aceptar la “cita” y por lo tanto intercambiar “hipervínculo” (Una forma muy sutíl de intercambiar enlaces). Una práctica de domainers cuyo único fin es establecer un mayor nivel de visitas y por lo tanto un incremento estadístico de probabilidades de aumentar los clicks en su oneróso y muy lucratívo AdSense. (En este caso francamente poco le voy a aportar, dado que este blog es nuevo, además de un experimento de no visibilidad sintáctico pero si semántico)

     
c
Crea una nueva entrada
j
Siguiente entrada / Siguiente comentario
k
anterior entrada/anterior comentario
r
respuesta
e
editar
o
mostrar/ocultar comentarios
t
ir al encabezado
l
go to login
h
mostrar/ocultar ayuda
esc
cancelar