HD+ is Digital Art History

MOD Málaga Open Data

Data is a precious thing and will last longer than the systems themselves.

Tim Berners-Lee, inventor del World Wide Web.

Tipos de datos
Es posible utilizar una gran variedad de tipos de información en el mundo Open Data. Puedes ver esta imagen aquí

HD+ MOD es la herramienta. La ciencia la haces . MOD ha recogido para tí la ubicación de los centros culturales y educativos, clasificados por niveles de conocimiento y tipologías, ubicados en los límites del término municipal de la ciudad de Málaga. Juega con ellos: ¿Cuál es el más cercano? ¿Qué distancia hay de un instituto a un museo? ¿Puedo construir una ruta óptima para saber más de la ciudad? La respuesta está aquí. Pero los datos, sin relaciones, no aportan información. MOD los pone en su contexto geográfico. Barrios y distritos municipales, áreas de influencia y ámbitos de cobertura definen a qué zonas qué y a quién afecta cualquier actuación o propuesta cultural y educativa. ¿Te imaginas que fuese posible planificar el alcance y el impacto de tus ideas? ¿Saber de antemano si puede interesar o no un proyecto? Pues aquí podrás comprobarlo… Sin embargo, en el mundo de las Humanidades nada es casual: los acontecimientos pasados no determinan, pero influyen de forma muy significativa en el presente y en un previsible futuro. Así que deber cargarte de razones y recurrir a aquello que otros fueron capaces de ver y usar antes que tú. ¿Qué tal si ves las cosas con sus propios ojos? ¿Y si fueras capaz de ponerte en su lugar? Despeja todas tus dudas e incertidumbres: pulsa aquí.

Y, a todo esto, ¿solucionará MOD todos mis problemas a la hora de averiguar una ruta entre puntos de interés en la ciudad, o realizará las deducciones pertinentes sobre el tema que yo plantee esclarecer? ¡NO! Decididamente no. En absoluto. MOD es una herramienta. El criterio, la metodología y el análisis corren de tu cuenta. Aquí no respondemos a tus dudas: las creamos, y procuramos retarte con ellas. Busca la verdad. Intenta encontrar la explicación que subyace bajo las cifras. No queremos que te dejes llevar "por lo que otros afirman". Pon todo en cuestión. No aceptes las respuestas porque "otros, con más experiencia" las dan por válidas. Investiga.

"Vale. Me habéis convencido. Pero yo solo no soy capaz de organizar todo los necesario para trabajar con datos de manera rigurosa y, a la vez, flexible, abierta a la crítica y susceptible de adaptarse a los descubrimientos y las aportaciones que tanto yo como otras personas realicen. No me veo capaz. Me falta formación…" ¿Seguro? ¿No te sientes preparado para trabajar con criterios científicos, sin dogmas, sin ataduras y con la mente abierta a los descubrimientos? Pues puedes trabajar con nosotros. Nos gustaría contar contigo. ¿Te atreves? Si es así, mándanos un mensaje explicando brevemente tus razones y qué deseas conseguir. No hace falta ser informático ni teleco, porque la parte tecnológica puntera la ponemos nosotros. Simplemente necesitas un fuerte deseo de formar parte de un proyecto ilusionante y con trayectoria y una insaciable curiosidad 😻.

De acuerdo. Pues   veamos ese mapa   o esos datos.


Open Data [OD]

If we have data, let’s look at data. If all we have are opinions, let’s go with mine.

Jim F. Barksdale, antiguo director de Netscape.

Y ¿qué es eso de "Open Data"?

Pues verás, es fácil y —como casi siempre sucede— a la vez difícil de explicar. Esta página ha sido concebida para "predicar con el ejemplo" y asomarte al mundo de los datos en abierto de nuestra mano. En principio, el concepto alude a la idea de que algunas referencias deben ser de libre acceso para todos, de forma que se puedan utilizar y volver a publicar como se desee, sin restricciones de derechos de autor, patentes u otros mecanismos de control. Los objetivos del movimiento de datos abiertos son similares a las de otros de la misma índole, como código abierto, open hardware, etc. La filosofía detrás de esta iniciativa se ha establecido con firmeza a largo del tiempo (por ejemplo, en la tradición mertoniana de la ciencia), pero el término "open data" (también expresado como OpenData) en sí es reciente, y ha ido ganando popularidad con el auge de Internet y la World Wide Web y, sobre todo, con el lanzamiento de las iniciativas gubernamentales de ese tipo, como data.gov, data.gov.uk o, en el caso español datos.gob.es.

Es comprensible que quieras conocer más detalles sobre algo que parece utópico pero que, sin embargo, no solo es muy real, sino que cada día gana terreno en el mundo administrativo, político y empresarial. Te sugerimos que consultes esta excelente página, en español, que te aclarará algunas ideas. Open Data Handbook es una magnífica iniciativa auspiciada por muchas instituciones. No te la pierdas.


HD+ y OD

There’s nothing to be scared of in open data. Unless you’re taking money where you shouldn’t be taking money.

Peter Corbett, director ejecutivo de iStrategyLabs

Te contamos de qué va esto.

En línea con la metodología del poral HD+, en sintonía con Espacio Cienfuegos y su propuesta Open Data, a la que se han sumado el Ayuntamiento de Málaga, la UMA y el grupo iArtHis_LAB, entre otros organismos y empresas, hemos decidido realizar esta página de demostración de las posibilidades del uso de datos y tecnologías abiertas, desde el espíritu colaborativo propio de DH/DAH.

No son siglas extrañas que usemos porque sí. DH es el acrónimo de Digital Humanities, y DAH el de Digital Art History. No los ponemos en español, porque está más extendido el uso en inglés a nivel internacional.

Pero hay más, mucho más. Open Data es, en gran medida, un mundo que está comenzando a abrirse a la exploración.

La Universitat Oberta de Catalunya aporta una interesante definición de las iniciativas OpenData y RISP.

Open Data es una filosofía que tiene por objetivo poner a disposición de la sociedad los datos que gestiona la administración pública en formatos fáciles de manipular. Cualquier ciudadano o empresa puede analizar, reutilizar y redistribuir estos datos, generando nuevos servicios y permitiendo que la administración pública mejore en transparencia (gobierno abierto) y fomente la generación de riqueza a través de la gestión inteligente de los recursos (gobierno inteligente).

El objetivo es que ciudadanos y empresas puedan reaprovechar estos datos para generar valor económico. Podrán construir sobre ellos una nueva idea que genere nuevos datos, conocimientos o incluso la creación de nuevos servicios que reporten beneficios económicos y/o sociales. A estas empresas o personas se les denomina "infomediarios" o "reutilizadores".

¿Crees que son demasiadas siglas? No tantas, no exageres. Y todas ellas casi autoexplicativas. Verás…

Los términos Open Data y RISP (Reutilización de la Información del Sector Público) están muy relacionados. En ambos casos se trata de poner a disposición de la sociedad datos "en bruto" que mantenga la administración. Aunque los términos puedan parecer similares, el concepto Datos Abiertos persigue ofrecer los datos en formatos completamente libres (no propietarios) y no se contempla el pago por el uso de datos (deben ser gratuitos). Sin embargo, la reutilización de la Información de las Administraciones Públicas prevé la posibilidad del pago por el uso de estos datos y la publicación de los datos en cualquier formato.

Y, para completar tu colección, un acrónimo más: LOD (Linked Open Data), puesto que lo que realmente confiere auténtica potencia al uso de estos grandes conjuntos informativos es su capacidad de ofrecer más sabiduría que la procedente de sus propios orígenes al enlazarse entre sí. Pura heurística: "el todo es mayor que la suma de sus partes" ;-)


Principios OD

Errors using inadequate data are much less than those using no data at all.

Charles Babbage, matemático filósofo, inventor e ingeniero.

Y continúan los de la UOC…

Para asegurar que se está hablando de Datos Abiertos y no de un sucedáneo que no entraría dentro de la filosofía real del Open Data, es necesario que los datos ofrecidos cumplan los siguientes principios:

  • Públicos
    Se deben abrir todos los datos de carácter público (todos aquellos, claro está, que no estén sujetos a restricciones de privacidad, seguridad o derechos de autor). Así, no debería existir ninguna otra traba por parte de la administración a la hora de decidir qué datos es pertinente publicar
  • Detallados
    Hay que publicar los datos tal y como están en su origen, sin procesar y, por tanto, manteniendo el mayor nivel de detalle posible, lo que se conoce como datos en bruto.
  • Actualizados
    Los datos deben ser puestos a disposición de los usuarios con la frecuencia necesaria para que no pierdan su valor y sean precisos y actuales.
  • Accesibles
    Hay que hacer accesibles los datos al mayor número de usuarios posible. No debería existir ninguna restricción para todos aquellos que quieran hacer uso de los datos, ni en el propósito de uso.
  • Automatizados
    Los datos deben estar estructurados para que puedan ser procesadas de forma automática por un ordenador. Esta es una condición muy importante para que se puedan reutilizar los datos de una forma automática.
  • Sin registro
    Los datos deben estar disponibles para todos, sin necesidad de identificarse previamente.
  • Abiertos
    Los formatos de los datos deben ser no propietarios; es decir, no pueden depender de una entidad o de una herramienta propietaria de una entidad. Como ejemplo, un formato abierto sería CSV o XML, mientras que formatos propietarios serían Word, Excel, etc.
  • Libres
    Los datos deben ser de uso 100% libre para los usuarios. Así, los datos deben estar libres de derechos, patentes, copyright y no estar sujetos a derechos de privacidad, seguridad o privilegios que puedan estar regladas por otras normas.

Quiero ver más en la UOC…

Que sí, que sí, que esto va en serio, muy en serio. Si hay alguien cuya voz no puede ser desoída con facilidad en el mundo de la telemática es Berners-Lee. Tim es ni más ni menos que el papá de la web tal y como la conocemos. Lo suyo es, sinceramente, de aurora boreal. Llamarle "vidente" se quedaría corto. Es una de las personas con mayor capacidad para prever qué deparará el futuro en el ámbito tecnológico que el mundo ha conocido. Y desde su inconmensurable conocimiento de cómo iban a evolucionar las cosas, Timothy ("Sir" Timothy, cabría decir) fue capaz de anticipar que la clave son los datos, el contenido, jamás el "continente". Aunque la mona se vista de seda…

No podía faltar. Tenía que ser él

Tim Berners-Lee, el inventor de la Web e iniciador de los Datos Enlazados (Linked Data), sugirió un esquema de desarrollo de 5 estrellas para Datos Abiertos. A continuación te mostramos ejemplos para cada escalón o nivel de estrellas y te explicamos los costos y beneficios involucrados en cada caso.

Clasificación Open Data según Tim Berners-Lee

Datos publicados en web, en cualquier formato y cubiertos por una licencia abierta. PDF
Datos publicados en web, en formato estructurado (por ejemplo, Microsoft™ Excel®). XLS
Datos publicados en web, en formato estructurado no propietario (es decir, que no esté registrado como exclusivo de una empresa o persona). Por ejemplo, CSV. CSV
Datos publicados en web pero accesibles sin necesidad de descargarlos una y otra para poderlos usar, sino directamente, a través de una URI (aplicaciones RESTFul o de tipo AJAX). JSON
Lo mismo que con cuatro estrellas, pero enlazando los datos con otros, de la misma o distinta fuente, de forma que exista un contexto para facilitar la interpretación de los mismos (LOD). LOD

DAM

It is moving from the tyranny of the expert to the wisdom of the crowd.

Emer Coleman, Government Digital Service.

¿Cómo? ¿Qué eso de "DAM"?

Pues verás, el Ayuntamiento de Málaga decidió hace ya algún tiempo, de acuerdo con lo que ya te hemos mostrado en la información sobre Open Data, hacer público el conjunto de datos e información que custodia*. Loable iniciativa, incardinada dentro del movimiento, lento pero, pese a las reticencias aún existentes de numerosos sectores, imparable. El organismo municipal creó un portal: datosabiertos.malaga.eu, y por eso tales siglas: DAM.

[*] Significativamente (¿lapsus calami o "por la boca muere el pez"?), el Ayuntamiento de Málaga habla de "posesión" de dichos datos. Es propablemente el resultado de una mala redacción o de improvisación poco profesional a la hora de escribir la página, pero numerosas instituciones creen ser detentadoras de la titularidad exclusiva y excluyente de los datos obtenidos a partir del ejercicio de sus funciones, y precisamente contra eso combate la filosofía de datos abiertos.

Y ¿qué tal lo hacen?

Pues no todo es de color rosa. Como suele suceder, hay claroscuros en tan buena idea.

Afirma el portal que los datos están disponibles en formatos de intercambio accesibles, utilizables por los ciudadanos, lo que les permiten tratar informaciones a partir de las cuales se pueden realizar sugerencias sobre las políticas del gobierno aplicadas en las diferentes áreas municipales.

Y en general se cumple tal afirmación. Pero… (¡ay, siempre un "pero"…!) eso no es cierto en todos los casos. En concreto, el que nos ha afectado más en este proyecto es el de los archivos shape ESRI SHP. Hay un fallo crucial que impide el uso individual de los diferentes ficheros con tal formato que se ofrecen en el portal. Normalmente se trata de carpetas comprimidas ZIP que contienen diferentes archivos, los más importantes de los cuales son aquellos cuyo nombre termina con las extensiones "shp" (llevan las definiciones de las figuras geométricas que se representarán en el plano) y "dbf" (pequeñas y anticuadas bases de datos para transportar la información textual sobre cada figura).

Pero falta un archivo adicional, normalmente con la extensión "prj" (de project) que sirve para georreferenciar lo dibujado por el sistema que interprete la información. Dicho en otras palabras: sin ese archivo es posible trazar las figuras y asociarles texto, pero no sabemos en qué lugar del planeta se encuentran.

Este inconveniente no se debe a un olvido, sino a que DAM facilita la información planimétrica municipal en un conjunto de carpetas SHP correspondientes al aplicativo que el Centro Municipal de Informática (CEMI) utiliza para el trabajo cotidiano. Las correspopndientes al "plano base", sobre el que se construyen los demás diseños, contienen el archivo "prj", pero éste no se ha incluido en los otros archivos individuales.

Con casi toda probabilidad, los problemas con los archivos SHP se deben a que DAM es un proyecto en desarrollo, que se perfecciona día a día y que aún no ha llegado a la fase de sustitución de todos los archivos shape por su equivalente en formatos abiertos que puedan ser enlazados de forma dinámica (las de Tim Berners-Lee). Pero estamos seguros, a la vista de los hechos hasta ahora constatables, de que Datos Abiertos Málaga será capaz de alcanzar los más ambiciosos objetivos en el terreno OD.

Pues me quedan dudas…

¿Es DAM un proyecto fallido?

Ni muchísimo menos. No desacreditamos tan excelente trabajo, pero hemos de señalar sus fallos, y este es bastante significativo, porque, por ejemplo, impide leer de forma remota el contenido con bibliotecas de código y geointerpretarlo adecuadamente. Es preciso crear un cierto "Frankenstein" pegando fragmentos de distintos archivos SHP. Y eso no se ciñe adecuadamente al espíritu Open Data.

Hay otros problemas, no tan directamente relacionados con un fallo de diseño como con ciertas "manías" demasiado extendidas en el mundillo de datos abiertos. No son específicamente errores, pero no favorecen el uso de los datos. Por ejemplo, entre los 653 conjuntos de ellos que se ofrecen a comienzos de octubre de 2016 figuran 29 en formato Adobe Acrobat (PDF) y 19 fuentes de sindicación de noticias RSS. Esos 48 grupos son muy poco utilizables. PDF es una suerte de "fotocopia digital", estática y que no permite con facilidad (hay medios, pero no son tan precisos ni asequibles como en otros casos) extraer la parte informativa y significativa y poder realizar operaciones o recuentos con ella. Y RSS es un canal de difusión (broadcasting) que, si bien puede ser analizado, no se caracteriza precisamente por emplear datos con organización coherente.

Estas cuestiones, no obstante, no empañan en absoluto lo que no podemos por menos que juzgar como un gran trabajo. El Ayuntamiento de Málaga está cumpliendo, como debe de ser, con la obligación política y administrativa de permitir que la ciudadanía emplee adecuadamente las referencias que publica. Así que valgan estas líneas como reconocimiento a una labor de una trascendencia cada vez mayor y al deseo de participar activamente en el desarrollo de la sociedad por medios tecnológicos.

Además, CEMI ha hecho un excelente trabajo desarrollando herramientas, basadas mayoritariamente en Python, un eficientísimo y muy asequible lenguaje de programación de alto nivel, basándose en CKAN, que posiblemente sea la plataforma para soporte de políticas Open Data más ampliemante difundida a día de hoy, y con el que han tenido tanto éxito que sus proyectos, disponibles —no podía ser menos— en GitHub, son utilizados por otras entidades municipales como Alcobendas o Rivas Vaciamadrid.

Vale, me habéis convencido. DAM es un excelente proyecto, no exento de errores pero con una trayectoria impecable. ¿Y vosotros?

Pues nuestro papel ha consistido en racionalizar correctamente la información extraída de los shapes y darle un sesgo adecuado para poder emplear los resultados obtenidos como "herramienta".

Ten en cuenta que nuestro enfoque, el de iArtHis_LAB y HD+, es la aplicación del paradigma digital en el campo disciplinar de la Historia del Arte, encajando tal perspectiva en el amplio concepto de las Humanidades Digitales. Por tanto, tenemos, por así decirlo, una clara vocación de servicio a la comunidad investigadora. Desarrollamos aplicaciones que pueden ser empleadas para extraer de los datos que en ellas se gestionan nuevo conocimiento.

Eso no es hablar por hablar. Se trata de usar tales datos de manera que su análisis cuantitativo, leído desde el acervo de sabiduría acumulada por profesionales adecuadamente formados, pueda ser interpretado de manera que aporte novedades antes no consideradas al respecto de determinados temas. No es magia, ni (¡oh, las viejas costumbres…!) "traición a los principios" de la ciencia histórica. Salen, al poco de contar esto, innúmeras voces al grito de "no somos científicos de bata blanca" rechazando de plano cualquier insinuación de utilizar metodologías numéricas en este ámbito.

"El arte no es medible", "no cabe usar matemática en el fenómeno estético" o "el placer de la contemplación no ha de pasar por detectores" son algunas de las lindezas que uno puede recolectar si osa sugerir el punto de vista digital. Yerran, y gravemente, quienes así se expresan. Porque lo que prima en tales casos no es la enconada defensa de un sistema de aproximación a la realidad válido y único, sino más bien la feroz batalla para impedir que alguien pueda "estropear" con "feos mecanismos automáticos" las bonitas teorías que se han creado sobre bases tan sólidas como la "apreciación personal" y la "percepción" (no creemos que sea necesario resaltar la ironía).

MOD

Listening to the data is important… but so is experience and intuition. After all, what is intuition at its best but large amounts of data of all kinds filtered through a human brain rather than a math model?

Steve Lohr, periodista de The New York Times y premio Pulitzer al mejor reportaje divulgativo en 2013.

Recapitulemos. Hasta ahora te hemos explicado que nuestro deseo último es contribuir a dotar a la ciencia histórica con mecanismos que permitan homologarla con el resto de disciplinas, haciéndola revisable, falsable y permitiendo la crítica contributiva, la discusión razonada y todo ello basado en argumentos que otros puedan obtener mediante el uso de las pruebas y los hechos cimentados en mecánicas experimentales, fácilmente reproducibles.

Y para predicar con el ejemplo, que es, sin duda, la manera más eficiente de convencer, hemos tomado partes de la información distribuida en DAM, la hemos completado —porque precisamente teníamos que emplear archivos SHP sin georreferenciación— y hemos puesto todo en un mapa. ¿Y eso para qué?, puede que te preguntes. Muy sencillo: queremos que nuestro enfoque digital de la Historia del Arte no sea un elemento "muerto" o "solo para expertos" en la sociedad que le rodea, sino que pueda tener aplicación directa, ponamos por caso, en el mundo de la enseñanza, el turismo o el transporte.

Pero antes de continuar contándote cosas, párate a mirar el diagrama que tienes al lado y que un excelente investigador, de formación híbrida ("ciencias + letras", según la más que obsoleta terminología que se utiliza desgraciadamente aún con demasiada frecuencia en el muindo académico español), el suizo Martin Grandjean ha sido capaz de generar analizando cuánto "mueven" en la conocidísima —y en numerosas ocasiones pésimamente empleada— red social de Twitter los principales centros de investigación sobre Digital Humanities. Parece que la cosa suscita más interés del que pudieras intuir antes de conocer el asunto, ¿verdad? Pues como nos parece que Martin es un profesional serio, te dejamos una frase suya para que reflexiones; a nosotros nos resultó tan sugerente que es una de las motivaciones para crear MOD: Il n’y aura pas de bonnes formations en humanités numériques tant qu’il n’y aura pas de bonnes recherches!. Como en román paladino suele expresarse, más razón que un santo…

OK. Pero ¿qué se puede hacer con MOD?

En realidad bastantes cosas, para tratarse solamente de un mockup. No aspira a más: algo así como "¿qué podríamos hacer, si ya somos capaces de…?". Y es que en iArtHis_LAB estamos hechos de esa pasta. Nos gusta incitar a la investigación. Como te hemos contado aquí en ningún momento pretendemos resolverte preguntas, sino hacer que te las plantees.

Para eso te hemos preparado un menú de los más atractivo. Mira.

  • Hemos utilizado un mapa de la ciudad. Pero no nos conformamos con lo más sencillo, sino que hemos seleccionado para tí veinte capas base, que incluyen nueve de cartografía convencional de Google, de Open Street, de MapBox, de la Junta de Andalucía, del Instituto Geográfico Nacional (IGN) e incluso del Catastro, diez de ortofotografías> cenitales y de satélite, suministradas por Google, IGN y su Plan Nacional de Ortofotogrfía Aérea (PNOA) y de nuevo la Junta de Andalucía, algunas de ellas tan interesantes para comprobar la evolución urbanística como las fechadas en 1956 y en 1977, y uno "artístico", que simula un trazado hecho ¡con acuarelas!
  • De DAM hemos reinterpretado tres capas de referencia que consideramos interesantes. No son las únicas, ni mucho menos, pero nos han resultado sugerentes y por eso las incluimos en esta maqueta. Son polígonos que definen áreas de especial denominación en la ciudad o que marcan ámbitos de alcance.
    1. Barrios.
    2. Distritos municipales.
    3. Zonas de influencia en un radio de 500m alrededor de los centros docentes no universitarios que imparten Educación Secundaria.
  • También DAM nos ha proporcionado dos capas de puntos de interés (POI o PDI) que hemos tenido que ajustar a causa del problema con la georreferenciación que te hemos contado. Tampoco son las únicas disponibles, ni por asomo, pero sí que nos parecen útiles para permitir que quien trate de realizar esas preguntas que te dijimos pueda hacerlo con buenos argumentos.
    1. Centros culturales. El Ayuntamiento de Málaga es muy genérico en esta definición, y entre ellos se incluyen desde museos hasta bibliotecas y monumentos.
    2. Centros docentes no universitarios que imparten Educación Secundaria. Tanto públicos como privados.
  • Por si te parece poco, hemos geoposicionado e incluido doce planos históricos de la ciudad, suministrados por la Diputación de Málaga a través de su servicio IDEMAP. Puedes superponerlos y jugar con su transparencia.

¿Qué? ¿Se te van ocurriendo preguntas? ¿Eres capaz de generar nuevo conocimiento, como te hemos retado a hacer más arriba, jugando con este set de herramientas? Estamos seguros de que sí, pero es posible que quieras saber algo más sobre la "sala de máquinas" de MOD. Así que…

Así funciona

With too little data, you won’t be able to make any conclusions that you trust. With loads of data you will find relationships that aren’t real… Big data isn’t about bits, it’s about talent.

Douglas Merril, director general de Zest Finance, una compañía especializada en Big Data.

😬 Hasta ahora sólo habéis contado cosas poco específicas, pero quiero saber más… ¿En qué se basa MOD?

Bueno, es una pregunta muy genérica, pero trataremos de contestarte. El desarrollo de software es mitad arte, mitad ciencia y mitad técnica —cuántas mitades… 😉—, pero, a grandes rasgos, se trata de un ejercicio de trapecio con red. Reinventar la rueda nunca ha sido eficiente. Así que MOD utiliza bibliotecas (en ocasiones referidas, en una pésima traducción de un false friend inglés, como "librerías") de código. Muchas. Y bien (o eso esperamos). Te lo diremos si sigues leyendo.

En realidad, el profesor Antonio Vaquero, uno de los pioneros de las ciencias computacionales en España, que fue capaz de diseñar ¡en 1964! el primer sistema de enseñanza automática de nuestro país, siempre se ha quejado de que en la Academia (RAE) no hay ni un solo informático, por lo que, por ejemplo, el término ordenador, un galicismo como un piano de cola, acabó imponiéndose. Si quieres saber más, lee este interesante artículo.

😐 Habladme de la "arquitectura" de MOD

Parece una palabra inapropiada, pero en ingeniería de software existe un concepto, que define algo así como los planos de un gran edificio en construcción y que hace alusión a la manera en que los diferentes componentes que se integran en un programa informático interactúan y se conectan entre sí, y a eso se le denomina arquitectura.

Pues, si te parecía poco, ahí va una nueva "palabrota": Un mashup*, también conocida como aplicación web híbrida, es una página o una aplicación web que usa contenido de más de una fuente para crear un único nuevo servicio que se muestra con una única interfaz gráfica. Por ejemplo, un usuario podría combinar las direcciones y fotografías de las sucursales de una biblioteca con un mapa de Google para crear uno. El término alude a una integración fácil y rápida que usa interfaces abiertos de programación de aplicaciones (API) y fuentes de datos de acceso público o protegido para producir resultados enriquecidos con nuevos significados, que no constituían necesariamente la razón original para la producción de los datos primarios. Prepárate, porque a continuacioón te vamos a dar detalles técnicos más específicos.

Canónicamente, la arquitectura de un mashup se divide en tres capas:

  • Presentación e interacción con el usuario. Las tecnologías utilizadas son HTML / XHTML, CSS, JavaScript, JavaScript y XML asíncrono (Ajax).
  • Servicios web. La funcionalidad del producto se consigue utilizando los servicios API. Las tecnologías utilizadas son XMLHTTPRequest, XML-RPC, JSON-RPC, SOAP y/o REST.
  • Datos. Las tecnologías utilizadas son XML, JSON en sus distintas variantes (ingcluyendo TopoJSON y GeoJSON) y KML.

Arquitectónicamente hay dos "estilos" de mashup: los que están basados en servidor y los que están basados en web. Así, mientras que los segundos suelen utilizar el navegador del usuario para combinar y cambiar el formato de los datos, los primeros analizan y cambian el formato de los datos en un servidor remoto, y después los transmiten al navegador del usuario en su forma final.

Desde el punto de vista de la ingeniería de software, los mashup parecen ser una variación de lo que se denomina un "patrón de fachada" —más terminología constructiva 🙆—. Es decir: un patrón de diseño que proporciona una interfaz simplificada de un grupo mayor de código (en este caso el que sirve para agregar los diferentes "corrientes" de datos e información recuperadas con APIs). Para acabarla de empatar, que te conste que los mashup suelen utilizarse en las empresas proveedoras siguiendo un concepto denominado "software como servicio" (Software as a Service o SaaS).

[*] Por cierto, mashup podría traducirse originamente del inglés como "mescolanza", aunque en argot, también significaba "intoxicación" o hacía referencia a algo que no funciona como se esperaba que lo hiciera. Más recientemente, la palabra suele emplearse en relación con la música, en especial con el trabajo de los disc-jockeys que mezclan diferentes canciones y estilos en una combinación perfecta.

😵 ¡Que pechá de siglas…! Simplificadlo

Vale, lo intentaremos y nos centraremos en lo que pretendemos conseguir y en cómo lo hemos llevado a cabo.

Hablando en plata, nos hemos guiado por los siguientes principios.

  • Hay que realizar una aplicación mashup que demuestre que, sin incurrir en gastos, desorbitados o razonables, da igual, es posible dotar a uno o más colectivos interesados en la gestión y el aprovechamiento de la información que sobre cultura y patrimonio está dispersa en diferentes instituciones públicas de una herramienta capaz de responder a sus consultas y que genere nuevo conocimiento a partir del existente.
  • Lo que se obtenga deberá estar a disposición de cualquier persona que desee emplearlo. Suyos son los datos, recolectados en su nombre. El Ayuntamiento de Málaga y su Diputación Provincial ofrecen buena parte de tal información de forma no onerosa en páginas web especializadas, así que es preciso aprovechar esa circunstancia.
  • El componente geográfico ha de ser esencial. Se trata de ver sobre el terreno la disposición de los diferentes elementos, para aprovechar su potencialidad predictiva o identificadora de ámbitos.
  • Haremos todo eso con ayuda del colectivo desarrollador, utilizando lo que la Red pone libremente a disposición de cualquiera. Será una forma de transmitir el mensaje de que ponerle puertas al campo y limitar el conocimiento por razones crematísticas no es precisamente una buena idea. A la recíproca, todo nuiestro código será de libre acceso. ¡Nada de copyrights ni derechos de propiedad…!

Puestos en marcha, estos "mandamientos" han determinado en gran medida las capacidades de MOD.

  • Debe comportarse como una responsive application. Es decir, debe porderse utilizar sin dificultades en los diferentes dispositivos que hoy en día casi cualquiera tiene a su disposición: tabletas, teléfonos móviles inteligentes, ordenadores,…
  • Ha de combinar la delimitación de zonas y áreas de acuerdo a las normativas, reglamentos y demás preceptos existentes con la ubicación, lo más precisa posible, de puntos de interés (POI) que, por sus características, puedan suscitar asociaciones válidas entre ellos y con los polígonos determinados en la zonificación mencionada.
  • Los POI deberán tener asociada información textual que aporte valor a su referencia geográfica. Debe ser posible buscar y o filtrar dicha información.
  • Debe también ser factible solicitar al sistema el trazado automático de rutas entre unos POI y otros, de manera que, mediante la citada asociación conceptual, puedan construirse trayectos que los enlacen tanto en su posición física como en su caracterización.
  • La inmensa mayoría del trabajo deberá ser realizado en el navegador del usuario, de manera que no sea precisa una costosa infraestructura y pueda ser instalado casi en cualquier servidor. Eso sí, el aludido navegador deberá disponer de tecnología reciente: no valdrán antiguallas, no preparadas para realizar cálculos complejos. Y, aunque parezca algo sesgado, para reafirmar la apuesta por el "soft" libre, huirá el aplicativo de exclusividades "propietarias", como las exhibidas por los productos Microsoft 😷.

Todo esto parece simple y claro. Lo difícil, cómo no, es ponerlo en práctica.

😈 Estupendo. Pero sigo con dudas

¡Ahí le has dado! Ya sabemos que el camino del infierno está empedrado de buenas intenciones… Por eso te decimos que es difícil, pero esperamos que, al contártelo, lo comprendas mejor. Allá vamos.

Hemos huido de la tecnología Google en materia de mapas, demasiado restrictiva para nuestras intenciones. Así que hemos optado por la potencia suministrada por Leaflet, una biblioteca que, pese a su juventud, es capaz, con un impacto de apenas 33 KB, de lidiar con representaciones, geográficas o no, de muy distintas procedencias.

Solamente hemos utilizado mecanismos basados en Javascript, el lenguaje más empleado para determinar las acciones y la conducta de los navegadores. Por tanto, MOD es un mashup basado en web, que sigue el modelo cliente-servidor pero haciendo descansar la carga principal de trabajo en el lado cliente. Los servidores (porque son más d euno) simpemente suministran los datos gráficos o textuales, pero no realizan cálculos.

Y "vamos de pobres". La aplicación está alojada en un recurso de web hosting sencillo y barato, sin requisitos especiales. De hecho, el sistema completo podría alojarse en cualquier servidor gratuito, puesto que ni siquiera requiere el uso de lenguajes de script específicos, como Python, Ruby, Java o PHP.

Originalmente, nuestra intención era haber usado sin necesidad de manipularlos los datos suministrador por el mecanismo DAM (si, si; si has olvidado lo que es, mira aquí). Pero ya te explicamos que, para nuestros propósitos, eso simplemente no era posible. Así que optamos por descargar los archivos SHP individuales y no georreferenciados, hacer nosotros la faena de posicionarlos en el mapa y convertir el conjunto a un modelo de datos GeoJSON. Por cierto, que la base de este mecanismo de almacenamiento y distribución de información coherente (es decir, organizada de manera que su contenido pueda fácilmente ser procesado según reglas lógicas sin necesidad de interpretación humana), JSON*, es probablemente el más difundido del ecosistema web.

Para operar con facilidad los planos históricos hemos preferido descargarlos (son más de 40 MB), y hemos de confesar que nos sorprende mucho la curiosa coincidencia entre muchas zonas que en siglos pasados tenían cierta importancia y, contra viento y marea, se han mantenido. Pero no te vamos a contar nada sobre ellas: queremos que las descubras tu. Los hemos dotado de la capacidad de modificar su "transparencia", para que la superposición sea más sencilla y resulte más visible su dibujo sobre la ciudad actual.

Hemos tirado del motor de Open Street Map para calcular rutas y trayectos isócronos, porque es gratuito y de libre acceso. Así podrás saber a dónde puedes llegar en un tiempo determinado.

[*] Desde luego… ¡vaya colección de siglas! Pero no te asustes 😄. JSON es el acrónimo de JavaScript Object Notation. Aunque en otros lenguajes de programación existe el concepto de array o "matriz", en Javascript propiamente dicho solo hay "objetos", o construcciones lógicas dentro de las cuales la información se agrupa según sus características. EN realidad, tu cerebro o el viejo archivador de la biblioteca donde buscabas libros por su título funciona así.

😱 De acuerdo ¡Vaya curro que os habéis pegado…!

No te quepa duda. Aunque la cosa es, en realidad, más engañosa de lo que parece. Ya los romanos afirmaban que nanos gigantum humeris insidentes, pero en el siglo XII Bernardo de Chartres popularizó el dicho, aunque fue Sir Isaac Newton, un genio como científico y un impresentable como persona, quien tuvo el debido éxito con una afirmación, digna de una verdad de Perogrullo pero radicalmente cierta, y de la que cualquier investigador debe ser siempre muy consciente. Lo hizo en una carta que dirigió a Robert Hook en 1676: If I have seen further it is by standing on the sholders [sic] of Giants. Así que nada de reinventar la pólvora amarilla: hemos usado tecnología probada y depurada por el inmenso colectivo desarrollador repartido a lo largo y ancho de Internet.

Aquí te dejamos una lista sucinta de las pricipales bibliotecas y rutinas Javascript que hemos utilizado, con expresión de para qué sirven. Si te pica la curiosidad, en el apartado de licencias las hemos enumerado en detalle.

  • Leaflet.js para recuperar las "losetas" desde los proveedores de información geográfica y armar los mapas. Además del núcleo de la misma, hemos empleado un buen puñado de "plugins" para aumentar su funcionalidad.
  • jQuery como sistema de base para trabajar y realizar operaciones. Algo así como el esqueleto del sistema.
  • Typeahead.js para ir "descubriéndote" conforme tecleas las referencias y POIs que desees buscar.
  • Handlebars.js para crear plantillas de trabajo que nos facilitan las operaciones.
  • List.js para gestionar los listados de POIs, ordenarlos, filtrarlos y buscar en su interior.

Y para todo ello nos hemos inspirado en BootLeaf, un excelente trabajo de Bryan McBride que, aunque algo anticuado estética y funcionalmente, ha constituido la mejor cimentación posible sobre la que construir nuestro edificio.

La interfaz gráfica se apoya en dos magníficos recursos de la Red: Twitter Bootstrap 3.x, para el andamiaje (que conste que no hemos querido decir framework) HTML y Font Awesome como fuente de iconos y señalización gráfica. Ah, y que no se nos olvide la impresionante colección de marcadores para mapas de MapIcons Collection.