https://frosthead.com

¿Big Data o demasiada información?

Todos sabemos que hay mucha más información en nuestros mundos de la que solía haber. En cuanto a cuánto más, bueno, la mayoría de nosotros no tenemos ni idea.

contenido relacionado

  • La infografía a través de las edades resalta la belleza visual de la ciencia
  • Por qué Google Flu Trends no puede rastrear la gripe (todavía)

Aquí hay una pepita invaluable sobre toda esa información, elogios de Dave Turek, el encargado del desarrollo de la supercomputadora en IBM: desde el año 2003 y trabajando hasta el comienzo de la historia humana, generamos, según los cálculos de IBM, cinco exabytes, eso es cinco mil millones de gigabytes de información. Para el año pasado, estábamos generando esa cantidad de datos cada dos días. Para el próximo año, predice Turek, lo haremos cada 10 minutos.

Pero, ¿cómo es esto posible? ¿Cómo se convirtieron los datos en un kudzu tan digital? En pocas palabras, cada vez que su teléfono celular envía su ubicación GPS, cada vez que compra algo en línea, cada vez que hace clic en el botón Me gusta en Facebook, está poniendo otro mensaje digital en una botella. Y ahora los océanos están prácticamente cubiertos de ellos.

Y eso es solo una parte de la historia. Mensajes de texto, registros de clientes, transacciones en cajeros automáticos, imágenes de cámaras de seguridad ... la lista sigue y sigue. La palabra de moda para describir esto es "Big Data", aunque eso apenas hace justicia a la escala del monstruo que hemos creado.

Es el último ejemplo de tecnología que supera nuestra capacidad para usarla. En este caso, no hemos comenzado a ponernos al día con nuestra capacidad de capturar información, por lo que un tropo favorito de expertos en gestión en estos días es que el futuro pertenece a empresas y gobiernos que pueden dar sentido a todos los datos que están recogida, preferiblemente en tiempo real.

Las empresas que pueden interpretar todas las migas de pan digitales que dejan sus clientes tendrán una ventaja, según piensan, no solo quién compró qué en la última hora, sino si tuitearon al respecto o publicaron una foto en algún lugar en el remolino de las redes sociales. Lo mismo ocurre con las ciudades que pueden recopilar datos de los miles de sensores que ahora salpican paisajes urbanos y convierten los caprichos de la vida de la ciudad, como el flujo de tráfico, en una ciencia.

Como era de esperar, las campañas políticas ya están dando el paso, explotando furiosamente los datos como parte de su enfoque en "nanotargeting" votantes para que sepan con precisión cómo lanzarlos por sus votos y dinero. Según las conclusiones de los analistas, según el columnista del New York Times Thomas Edsall, los republicanos muestran una preferencia por los restaurantes "The Office" y Cracker Barrel, mientras que los demócratas tienen más probabilidades de ver "Late Night With David Letterman" y comer en Chuck E . Queso.

Esta prisa por interpretar los restos digitales explica por qué Google anunció la semana pasada que comenzará a vender un producto que llama BigQuery, un software que puede escanear terabytes de información en segundos. Y por qué una startup llamada Splunk, que tiene tecnología que puede analizar grandes cantidades de datos de clientes y transacciones, vio que el valor de sus acciones se disparó casi un 90 por ciento el día en que salió a bolsa el mes pasado. Esto, para una compañía que perdió $ 11 millones el año pasado.

Ascenso del científico de datos

Pero incluso el acceso a las mejores herramientas de descifrado de datos no garantiza una gran sabiduría. Muy pocas empresas tienen personas en el personal con la capacitación no solo para evaluar montañas de datos, incluidas muchas cositas no estructuradas de millones de páginas de Facebook y teléfonos inteligentes, sino también para hacer algo al respecto.

El año pasado, el McKinsey Global Insitute emitió un informe describiendo "Big Data" como la "próxima frontera para la innovación", pero también prediciendo que para 2018, las empresas en los EE. UU. Tendrán una grave escasez de talento cuando se trata de las habilidades analíticas necesarias: como 190, 000 personas. Y afirma que otros 1, 5 millones de gerentes necesitarán capacitación para tomar decisiones estratégicas con el torrente de datos que se les presente.

Sin embargo, no todos creen en la magia de Big Data. Peter Fader, profesor de marketing en la Penn's Wharton School of Business, no está convencido de que más datos sean mejores. No es que él piense que una empresa no debería tratar de aprender tanto como pueda sobre sus clientes. Es solo que ahora hay tanto enfoque en agregar cada bit de datos que él piensa que el volumen se valora sobre el análisis verdadero.

Aquí está la toma de Fader de una entrevista reciente con la Revisión de Tecnología del MIT : “Incluso con un conocimiento infinito del comportamiento pasado, a menudo no tendremos suficiente información para hacer predicciones significativas sobre el futuro. De hecho, cuantos más datos tengamos, más confianza falsa tendremos ... La parte importante es comprender cuáles son nuestros límites y utilizar la mejor ciencia posible para llenar los vacíos. Todos los datos del mundo nunca lograrán ese objetivo para nosotros ".

¿Quiénes son tus datos?

Aquí hay una muestra de cómo se usa Big Data para resolver grandes problemas:

  • Saben cuándo han sido malos o buenos: si bien la mayoría de las empresas se centran en analizar a sus clientes, Amazon está obteniendo puntos al usar Big Data para ayudar a los suyos.
  • El estudio de los sementales: ¿Quieres saber qué toros engendran las vacas lecheras más productivas? La industria láctea ha ideado una forma de reducir los números.
  • Diagnóstico por datos: los investigadores de SUNY Buffalo están analizando conjuntos masivos de datos en su esfuerzo por determinar si existe un vínculo entre la esclerosis múltiple y los factores ambientales, como la falta de exposición suficiente a la luz solar.
  • Buscando problemas: una compañía llamada Recorded Future está extrayendo información de redes sociales y sitios gubernamentales y financieros para hacer pronósticos sobre cómo el crecimiento de la población, la escasez de agua y el clima extremo podrían conducir a futuros disturbios políticos y terrorismo.

Bonificación de video: capturar datos es una cosa. Hacer que se vea atractivo y comprensible es otro desafío. David McCandless habla sobre el poder de los "mapas de información" en esta charla TED.

¿Big Data o demasiada información?