Más allá de Big Data: por qué la diversidad de datos es un factor de éxito crucial

Los datos son el alma de las empresas en la era de la información.

Cada vez más, nos encontramos en condiciones de aprovechar tecnologías como el aprendizaje automático y el análisis predictivo, y los adelantos en la arquitectura e ingeniería de AI son en parte para agradecerles.

El gran aumento en la cantidad de datos que podemos generar, almacenar y examinar, gracias al Internet de las cosas y nuestro mundo siempre en línea, es lo que realmente ha hecho posible.

Por supuesto, las empresas que utilizan la información para tomar mejores decisiones no son nada nuevo. Lo que es diferente actualmente es la escala de información disponible (el volumen de datos generados por las empresas del mundo se duplica cada 1,2 años) y las oportunidades que brinda para innovar.

Las empresas que desarrollan sus operaciones en su capacidad para recopilar y usar datos están alterando las industrias todos los días. Amazon, Uber y AirB'n'B crecieron operacionalizando los grandes datos generados a través de sus propias actividades centrales en los mercados que individualmente han dominado. Los datos que van desde los clics en el sitio web hasta el consumo de combustible del vehículo se utilizan para adaptar los servicios a fin de satisfacer las demandas de los clientes y agilizar los procesos comerciales.

Ahora bien, los innovadores que buscan la nueva tecnología van más allá de los datos disponibles de inmediato de sus principales actividades y operaciones.

Cuando se trata de datos, como ocurre con todos los demás aspectos de los negocios, la diversidad es de importancia crítica. Esto es cierto en un meta-sentido, ya que los conjuntos de datos no representativos tienen menos probabilidades de arrojar información práctica que aquellos que cubren todas las facetas del tema bajo investigación. También es cierto en términos de la variedad de datos disponibles.

La variedad siempre ha sido una de las "V" fundamentales de Big Data, junto con el volumen, la velocidad y varios otros que se han ido añadiendo a lo largo de los años. Hoy, con la gran divergencia de conjuntos de datos disponibles, es más importante que nunca, ya que a menudo se puede encontrar información en lugares inesperados.

Para lanzar una estrategia realmente diversa basada en datos, la clave es pensar más allá de los datos que una organización ya tiene disponibles, o que serían los más simples de recopilar. Gracias a los avances en la tecnología, como el análisis de imágenes y el procesamiento del lenguaje natural, se puede extraer el significado de forma automática del video, la escritura a mano, el discurso grabado y el texto de mensajes de correo electrónico y redes sociales.

En el campo de la atención médica, esto ha hecho posible que los robots diagnostiquen pacientes de manera eficiente y precisa en base a datos de imágenes de escaneo médico correlacionadas con las notas manuscritas de sus médicos. En ciertas situaciones, las máquinas han demostrado ser capaces de hacer esto al menos con la misma precisión que (los mejores) humanos y con una velocidad de rayo.

Y en marketing, los anunciantes están desarrollando métodos para comprender mejor las vidas y los hábitos de sus clientes, analizando cómo, cuándo y dónde se habla de sus productos, cómo se fotografían y se publican en las redes sociales.

De hecho, esta información desordenada, fragmentada y desordenada constituye más del 90% de los datos generados en todo el mundo. El resto es bueno, datos estructurados ordenados, a menudo generados por máquinas que hablan entre sí y que hacen registros. Esta información se compone de números que pueden ubicarse fácilmente en cuadros y tablas y analizarse con matemáticas simples. Además de constituir la mayor parte del volumen de nuestros datos, es muy probable que los datos no estructurados contengan la mayoría de los conocimientos aún no descubiertos. Llegar a ellos no siempre es fácil, pero las recompensas para quienes tienen la iniciativa y la imaginación para probar son potencialmente enormes.

Otras fuentes de datos que se minan cada vez más para obtener información incluyen datos de ubicación como el seguimiento por GPS y las imágenes satelitales. Poner esta información en funcionamiento habría estado más allá del presupuesto de cualquiera pero las organizaciones más grandes hace apenas una década. Ahora los agricultores de todo el mundo se están acostumbrando a la idea de combinar datos satelitales y meteorológicos para determinar el momento óptimo y la ubicación de los cultivos, y los minoristas rastrean los movimientos de los compradores que utilizan comunicaciones de campo cercano que interactúan con sus teléfonos inteligentes. Gracias a la aparición de la provisión de infraestructura "como servicio", las startups de cualquier parte del mundo pueden acceder a diversos conjuntos de datos, procesarlos y aprender de ellos.

Tags


Avatar

_Barry

Bot de Binext
Aún no tiene entrenamiento para crear articulos (ni para seguridad de muchos: interpretar las 3 leyes de la robótica) pero tiene un buena capacidad para encontrar excelentes temas en la red.

Comentarios para esta entrada

Sección en desarrollo...