sql >> Base de Datos >  >> RDS >> Database

Contenido no estructurado:una fuente de combustible sin explotar para la IA y el aprendizaje automático

Por Alex Welsh , vicepresidente, práctica analítica, Ephesoft

¿Eligiría adónde ir de vacaciones si sólo pudiera acceder al 10 o 20 por ciento de las reseñas e información en un sitio web de viajes? Si lo hace, probablemente tendrá un viaje inolvidable, pero por razones que quizás no le gusten. Sin embargo, las organizaciones gubernamentales y las empresas, desde la fabricación hasta las compañías de seguros, desde la atención médica hasta la banca, están tomando decisiones en esta misma línea. Y lo han estado haciendo durante años. Miran la información fácil que pueden obtener de los datos estructurados mientras ignoran sus datos no estructurados, que Deloitte cree que pueden representar del 80 al 90 por ciento del contenido generado a nivel mundial, lo que hace que los datos no estructurados sean una gran fuente de valor sin explotar.

Afortunadamente, los avances en IA (inteligencia artificial) y el aprendizaje automático ahora hacen posible y asequible filtrar y encontrar significado en grandes cantidades de datos no estructurados obtenidos de archivos de video y audio, correos electrónicos, registros, publicaciones en redes sociales e incluso notificaciones. desde dispositivos de Internet de las cosas (IoT). Todos estos datos pueden generar enormes beneficios, como cuando se utilizan para automatizar tareas que son intensivas manualmente y, a menudo, muy repetitivas. Una tarea, por ejemplo, es estar atento a las señales de alerta:criterios o comportamientos específicos que pueden indicar que algo anda mal y que se deben tomar medidas correctivas rápidamente. Veamos algunos casos de diferentes industrias.

¿Qué tal un reclamo de seguro que parece estar bien en la superficie, pero merece ser investigado, o un solicitante de empleo que puede estar ocultando información? ¿Qué pasa con un envío de productos farmacéuticos altamente perecederos que pueden no haber sido refrigerados durante una parte de su viaje, o un contrato que puede violar las leyes de un país o romper un acuerdo existente con otra empresa? Lo importante es que una bandera roja indica problemas que, si no se controlan, podrían causar un gran daño.

La inteligencia artificial tiene una gran demanda de datos

¿Cómo la IA y el aprendizaje automático permiten un análisis de datos más eficiente y eficaz? A través de la alimentación de datos. Al dar a un modelo de aprendizaje automático ejemplos de transacciones buenas y malas, se aprende a distinguir entre los dos tipos. Y, cuantos más datos procese el modelo de aprendizaje automático, más reforzará esas lecciones, mejorando la precisión.

Entonces, aunque la IA y el aprendizaje automático están logrando grandes avances, las empresas y otras organizaciones deben ponerse al día. Piénselo de esta manera:los datos son como el combustible. Lo necesitamos para potenciar nuestro pensamiento para tomar decisiones sabias. Pero hemos extraído todas las cosas fáciles, los datos estructurados que llegan en paquetes agradables y ordenados. Pero, aquí es donde la analogía del combustible se rompe:aunque otro galón de gasolina nos permite conducir otras 20 a 30 y pico millas, cuantos más datos ingresemos, más nos permitirán tomar decisiones significativamente mejores y más precisas, no solo otras 20 a 30 millas. -valor de millas impares—y para hacerlos aún más rápidos.

Sin embargo, durante mucho tiempo una enorme parte de nuestros datos, nuestros datos no estructurados, no se han explotado porque eran demasiado caros y difíciles de acceder y procesar. Y, aunque ese ya no es el caso a medida que la nueva tecnología para recopilar y analizar datos no estructurados está disponible, muchas personas en negocios y otras organizaciones han pasado por alto estos avances.

Dónde está el dinero inteligente

International Data Corporation (IDC) predice que para 2020 las organizaciones que analizan datos estructurados y no estructurados, es decir, todos los datos relevantes, y brindan información procesable obtendrán ganancias de productividad adicionales de $ 430 mil millones sobre sus competidores que no realizan dicho análisis de datos. Y las empresas que entienden esto no esperarán hasta 2020. Un ejecutivo de una compañía de seguros multinacional con sede en Alemania se refiere a los datos no estructurados como su mayor riesgo. Entienden los números involucrados y están trabajando para asegurarse de que no los tome por sorpresa al escribir pólizas de seguro que los expongan a responsabilidades que podrían haber evitado.

El poder combinado de big data, IA y aprendizaje automático puede facilitar el procesamiento de información relacionada con desafíos aún más complejos. Por ejemplo, los bancos y otras organizaciones pueden detectar con mayor precisión y rapidez el fraude, la evasión fiscal, el blanqueo de capitales y otros esquemas mediante la extracción de lo que antes eran datos no estructurados y sin procesar. Esto les permite detectar y cerrar casos de fraude y abuso, así como evitar los muchos falsos positivos que pueden ocurrir cuando se confía únicamente en datos estructurados. Los acuerdos de financiamiento comercial, incluidos los contratos y múltiples fuentes de datos, entre países o empresas también se pueden examinar para determinar si existe fraude o desigualdades, ya sean intencionales o no.

Además, la IA y el aprendizaje automático pueden ayudar a los bancos y otros tipos de empresas a identificar y verificar mejor la identidad de sus clientes a través de procedimientos automatizados de Conozca a su cliente (KYC). Dichos procedimientos pueden ayudar a evitar que se utilicen, de forma deliberada o inadvertida, para actividades de lavado de dinero, así como ayudar a evitar el soborno y otras formas de corrupción. Los procedimientos KYC también pueden permitir a las empresas comprender mejor las necesidades y transacciones financieras de sus clientes, así como ayudarlos a administrar el riesgo de manera más prudente. Otras ventajas incluyen acelerar el tiempo de generación de ingresos al incorporar nuevos clientes, lo que hace que KYC no sea otro costo en el que incurrir, sino una fuente de ganancias.

La inteligencia artificial y el aprendizaje automático pueden aumentar su competitividad

Con todos los beneficios obtenidos a través de la inteligencia artificial y el aprendizaje automático, y los avances tecnológicos utilizados para procesar datos estructurados y no estructurados, es hora de que más empresas y organizaciones aprovechen la mayor fuente de información disponible:sus propios datos no estructurados.

Sobre el autor

Alex Welsh lidera la práctica de análisis global de Ephesoft. Es un director de ventas experimentado, gerente de proyectos y empresario apasionado por resolver los problemas de misión crítica de los clientes con soluciones tecnológicas innovadoras y rentables.