La tendencia de los datos abiertos se está afianzando en todo el mundo y desatará una innovación incalculable.
McKinsey señala que los datos abiertos, que son datos que pueden usarse y redistribuirse libremente, podrían contribuir $3 billones anualmente a la economía global y tiene el potencial de “liberar la innovación y transformar todos los sectores de la economía”. El Banco Mundial También reconoce “el enorme potencial de los datos abiertos”, señalando que el uso de datos gubernamentales abiertos por parte de empresas privadas “apenas ha comenzado a ser explotado”.
La Unión Europea, que a menudo va a la cabeza en términos de adopción de iniciativas digitales, tiene su Directiva de datos abiertos, que recientemente agregó nuevos “conjuntos de datos de alto valor” que los organismos del sector público deben poner a disposición para su uso gratuito. Estos conjuntos de datos proporcionan datos geoespaciales, ambientales, meteorológicos, estadísticos, de movilidad y empresariales, con el objetivo de avanzar en la transformación digital de la sociedad y mejorar la movilidad, la atención médica, la conservación de energía y la sostenibilidad, por ejemplo.
Como señaló el comisario Thierry Breton, “las empresas emergentes y las pymes podrán utilizar estos datos para desarrollar nuevos productos y soluciones innovadoras que mejoren la vida de los ciudadanos en la UE y en todo el mundo”.
Fundación de mapas de obertura
En el Fundación de mapas de obertura, estamos acumulando lo que creemos será la colección más grande del mundo de datos cartográficos abiertos de nivel empresarial que cualquiera, en cualquier lugar, puede utilizar para crear servicios cartográficos interoperables. Con los datos correctos, se pueden implementar rápidamente servicios como navegación, búsqueda local, gestión logística y realidad aumentada basada en la ubicación.
Sin embargo, a medida que los requisitos de precisión, puntualidad y funciones avanzadas continúan expandiéndose, también crece la necesidad de una capa base de datos abierta. Al basarse en capas de datos comunes y abiertas, los datos de valor agregado se pueden combinar más fácilmente y proporcionar una mejor interoperabilidad entre plataformas. La tarea de crear y mantener estas funciones cartográficas avanzadas y ricas en datos, necesarias para mapear un mundo en continuo cambio, es demasiado grande, demasiado compleja y demasiado costosa para que la aborde una sola entidad.
Los mejores datos cartográficos, hasta ahora, han sido propietarios. Los costos de crear y mantener esos datos solo han aumentado a medida que ha crecido la demanda de mejores datos. Dada la gran cantidad de fuentes y formas de recopilar y presentar datos, la interoperabilidad ha sido difícil, lenta y limitante. Al crear una amplia red de usuarios que consumen servicios de mapas y brindan comentarios sobre la precisión de los datos, la industria puede crear los mejores datos de mapas disponibles. El uso abierto a través de licencias abiertas es fundamental para ampliar ese alcance.
La idea básica de los datos de mapas abiertos es la misma que para software de código abierto: construir colaborativamente un activo que cualquiera pueda usar, cambiar y luego redistribuir. El modelo abierto, iniciado hace unas tres décadas para desarrollar el sistema operativo Linux, dio origen a una industria de software de código abierto que ahora vale billones, según un reciente Informe de la Escuela de Negocios de Harvard notas. Si no fuera por el software de código abierto, las empresas “tendrían que gastar 3,5 veces más en software de lo que gastan actualmente”, afirma el informe.
Algunas de las empresas de tecnología y localización más grandes del mundo, como AWS, Meta, TomTom y Microsoft, son grandes defensoras del código abierto porque reconocen el valor del código abierto para sus empresas y la economía. Por lo tanto, no debería sorprender que estas mismas empresas se unieran a fines de 2022 para lanzar Overture, que se encuentra entre los proyectos de datos abiertos más grandes del mundo alojados en la Fundación Linux.
La misión de Overture es crear datos cartográficos abiertos que admitan una amplia gama de aplicaciones cartográficas y análisis geoespaciales. Los datos cartográficos son la representación digital del mundo físico… un conjunto de datos masivo, complejo e interrelacionado. Para lograrlo, Overture agrega, elimina duplicados, mejora, estandariza y mantiene datos resultantes de muchas señales diferentes para crear conjuntos de datos fundamentales integrales que son valiosos para los creadores de mapas.
Por ejemplo, el tema Edificios de Overture combina datos de fuentes colaborativas de Abrir mapa de callesdatos gubernamentales de Programa de mapas comunitarios de Esriy huellas de edificios generadas por IA de Microsoft y Google. El conjunto de datos combinado incluye 2.300 millones de edificios, lo que lo convierte en el conjunto de datos de edificios abiertos más grande del mundo. Direcciones, redes de carreteras y lugares de interés son otros temas que dependerán en gran medida de la agregación de fuentes de datos abiertos.
Datos abiertos versus código abierto
Si bien existen muchas similitudes entre los proyectos de datos abiertos y los proyectos de código abierto, también existen diferencias notables. Esas diferencias pueden afectar quién decide trabajar con cada uno.
En mis nueve meses en Overture, he llegado a evaluar cómo y por qué difieren el código fuente abierto y los datos abiertos. Señalaría seis diferencias clave que tienen implicaciones importantes para los proyectos de datos abiertos:
- Generación de datos. El código de software se genera a partir del cerebro de un ser humano o de un número cada vez mayor de asistentes de codificación basados en inteligencia artificial. Por el contrario, los datos se crean mediante medición u observación, lo que requiere sistemas o proyectos para realizar esta detección. En el caso de los datos cartográficos, la detección puede incluir la construcción de una nueva carretera, un cambio en un lugar de negocios o la destrucción de un edificio existente. La comunidad en un proyecto de datos abiertos necesita acceder o desarrollar estos sistemas para medir y generar datos abiertos. Esta suele ser una necesidad constante: medir los datos a medida que evolucionan o cambian con el tiempo.
- Exactitud. Los datos abiertos reflejan hechos. Por tanto, tiene que ser lo más preciso posible. Los datos cartográficos son una representación digital del mundo físico. Esa representación debe ser lo más fiel posible a la realidad. En el desarrollo de software de código abierto, es común escribir código que se perfecciona posteriormente para adaptarse a casos de uso específicos. Esto conduce a un intercambio más rápido: el código sale al mundo más rápido y se mejora más rápido. Con datos abiertos, el rigor en torno a la precisión deberá ser mucho mayor desde el principio.
- Oportunidad. Algunos tipos de datos miden cosas que cambian constantemente, como la calidad del aire, las condiciones de las carreteras o las reseñas comerciales. Deben actualizarse cada mes, semana o incluso diariamente. Por eso, los proyectos de datos abiertos funcionan como una línea de producción. Actualmente publicamos una nueva publicación de datos cada mes y presionaremos para aumentar esa frecuencia. Con el software de código abierto, alguien podría publicar un código que no se utiliza, analiza o revisa durante días, meses e incluso años. Los desarrolladores que trabajan en datos abiertos enfrentarán diferentes requisitos de tiempo y expectativas sobre cómo trabajan.
- Costo y tamaño. El código fuente abierto normalmente implica un tamaño de datos manejable. En los casos de uso más simples, el código se puede ejecutar localmente en una computadora portátil. El costo de almacenar y entregar el código generalmente no es un factor. Los datos son diferentes. Los macrodatos, como los datos cartográficos del mundo, alcanzan los terabytes y los petabytes. Incluso en los casos de uso más básicos, esos datos deben almacenarse y entregarse a los usuarios y mantenedores, lo que puede requerir importantes inversiones iniciales.
- Licencia. Los datos tienen que venir de alguna parte. Podría ser “propiedad” de alguien, como una empresa privada, o podría combinar cualquier número de repositorios de datos abiertos existentes. Debido a que los datos se derivan de diferentes fuentes, los esquemas de datos deben fusionarse en un sistema coherente. A veces, algunos datos simplemente no se pueden combinar con otros sin el permiso explícito del propietario de los datos. El código fuente abierto también viene con licencias, pero si estamos escribiendo código, se conoce la licencia del código base existente y el autor es libre de escribir en él.
- Protección de la privacidad. Los datos pueden incluir información personal como direcciones y números de teléfono que pertenecen a personas reales y pueden incluir imágenes del mundo que contienen elementos identificables. Se debe tener cuidado para garantizar que se elimine toda la información de identificación personal. Este tipo de limpieza no suele ocurrir cuando se escribe o reutiliza código fuente abierto.
El camino por delante
Fueron necesarias décadas para que el código fuente abierto se extendiera al público general. Los datos abiertos pueden aprovechar los aprendizajes del movimiento de código abierto, pero tendrán que desarrollar sus propias mejores prácticas a medida que avance. A medida que eso suceda, conducirá a nuevos productos y servicios en industrias, gobiernos y economías enteras.
Los datos abiertos beneficiarán a las empresas que ofrecen servicios propietarios además de los datos abiertos, del mismo modo que el código abierto ha beneficiado a las empresas que se basan en código fuente abierto. Los consumidores, los gobiernos y las empresas obtendrán beneficios en términos de más y mejores bienes y servicios.
Marc Prioleau es director ejecutivo de Fundación de mapas de obertura.
—
New Tech Forum ofrece un lugar para que los líderes tecnológicos, incluidos proveedores y otros contribuyentes externos, exploren y debatan la tecnología empresarial emergente con una profundidad y amplitud sin precedentes. La selección es subjetiva y se basa en nuestra elección de las tecnologías que creemos que son importantes y de mayor interés para los lectores de InfoWorld. InfoWorld no acepta garantías de marketing para su publicación y se reserva el derecho de editar todo el contenido aportado. Envia todo consultas a doug_dineley@foundryco.com.
Copyright © 2024 IDG Communications, Inc.