Cómo dos mujeres chinas convirtieron sus tesis de doctorado en aprendizaje automático que establece conexiones entre eventos aparentemente no relacionados para descubrir esquemas de fraude emergentes.

En 2006, después de obtener su doctorado en Carnegie Mellon, Yinglian Xie no estaba pensando en si quería hacer carrera en Estados Unidos o en su China natal, y mucho menos en convertirse algún día en empresaria. En cambio, estaba muy concentrada en el mejor lugar para continuar su trabajo: su tesis trataba sobre la identificación de posibles amenazas a la seguridad en Internet mediante la búsqueda de correlaciones entre eventos aparentemente no relacionados. Terminó en los laboratorios de Silicon Valley de Microsoft Research, un centro de investigación sobre avances tecnológicos. “Eran realmente los mejores del mundo”, se maravilla Xie, señalando que entre sus colegas había varios ganadores del Premio Turing, también conocido como el premio Nobel de informática.

Tres semanas después, después de obtener su propio doctorado en la Universidad de California/Berkeley (también con una tesis sobre seguridad en Internet), Fang Yu llegó al mismo laboratorio. Las mujeres habían crecido a 30 minutos de distancia cerca de la ciudad de Suzhou, al oeste de Shanghái, y rápidamente se hicieron amigas y colaboradoras científicas.

Portada digital: Yinglian Xie de Datavisor, de Cody Pickens para Forbes
Cody Pickens para Forbes

Hoy, Xie, de 48 años, y Yu, de 46, tienen a sus espaldas decenas de artículos académicos y 11 años de luchas con startups. Ahora, la empresa que cofundaron en 2013, DataVisor, con sede en Mountain View, California, finalmente ha logrado abrirse paso en el área de protección de las firmas financieras y sus clientes contra el fraude. Con Xie como CEO y Yu como director de productos, los ingresos de DataVisor se dispararon un 67% en 2024 hasta los 50 millones de dólares, lo que le ayudó a aparecer por primera vez en la lista Fintech 50 de Forbes que reconoce a las startups de tecnología financiera más innovadoras de Estados Unidos. Entre sus clientes se incluyen SoFi, Affirm y Marqeta.

En la actualidad, los bancos y las empresas de tecnología financiera utilizan múltiples técnicas y proveedores de seguridad en una verdadera carrera armamentista con los estafadores; el nicho de DataVisor es encontrar redes de fraude emergentes antes de que puedan infligir grandes pérdidas. Estas redes encuentran continuamente nuevas formas de apoderarse de grupos de cuentas de usuarios, explotar vulnerabilidades como filtraciones de información crediticia para enviar solicitudes de préstamos fraudulentas o engañar a usuarios desprevenidos para que paguen por productos ilegítimos. Cada vez que se descubre una nueva red o método de fraude, los modelos de detección de fraude se pueden actualizar para detectar esas señales de alerta, pero eso no siempre ayuda a los usuarios que ya se vieron afectados.

“Con el aprendizaje automático típico, es necesario entrenarlo para que aprenda y mejore”, afirma Xie. “Siempre se es reactivo y se detectan patrones de ataque de meses atrás, cuando las cosas ya se han movido y cambiado”.

El ingrediente secreto de DataVisor es lo que se conoce como aprendizaje automático “no supervisado”, que utiliza algoritmos para analizar conjuntos de datos que no están etiquetados y descubrir correlaciones por sí solos sin que los humanos le digan qué objetivos o categorías buscar. Xie no entrará en detalles sobre lo que hace que funcionen los algoritmos patentados, pero da un ejemplo realista: imaginemos que una red de fraude obtiene acceso a los datos de un banco e identifica un determinado perfil de víctima, como clientes antiguos que tienen montos de transacción promedio altos y menos experiencia digital. Luego se les enviarían ofertas fraudulentas para comprar una tarjeta de regalo y, si el monto en dólares está por debajo de su transacción típica, es menos probable que active los filtros de fraude del banco. Pero el aprendizaje automático no supervisado de DataVisor podría hacer conexiones entre estos clientes del banco en milisegundos (conexiones que nadie le dijo que buscara) y bloquear la avalancha de ofertas falsas en tiempo real.

“Lo que hace único a DataVisor es que podemos hacer agrupaciones en tiempo real”, afirma Yu. “Todos los días o incluso cada hora surgen nuevos esquemas”. Esa capacidad es particularmente valiosa en estos días, dice Xie, porque “prácticamente todos los ataques importantes de hoy en día provienen de estas redes de fraude coordinadas”.

De hecho, un informe reciente de la empresa de verificación de identidad Au10tix declaró que 2024 sería el año del “fraude como servicio”. El número promedio de incidentes en cada “megaataque” coordinado se duplicó de 4.000 a 8.000, dice el informe, y esta mercantilización de la delincuencia está quitándole cada vez más dinero a los consumidores. Las pérdidas por fraude reportadas a la Comisión Federal de Comercio en los EE. UU. alcanzaron los 10.400 millones de dólares en 2023 y los 8.700 millones de dólares en los primeros tres trimestres de 2024, camino de establecer otro récord.


Esto es válido para Xie y Yu : tienen los conocimientos técnicos necesarios para respaldar sus afirmaciones de que sus algoritmos son superiores. Ambas fueron superestrellas universitarias: Xie ocupó el primer puesto entre 140 estudiantes de informática que se graduaron con ella en la Universidad de Pekín y Yu realizó prácticas con los miembros fundadores de Microsoft Research Asia mientras estudiaba en la Universidad de Fudan en Shanghái, lo que la inspiró a realizar un doctorado.

Ambos llegaron a Estados Unidos para realizar estudios de posgrado, creyendo que era el lugar ideal para estudiar informática de vanguardia. Obtuvieron la residencia permanente y se quedaron a trabajar para Microsoft, donde finalmente se convirtieron en ciudadanos.

En los siete años que trabajaron en Microsoft, ambos publicaron decenas de artículos que desde entonces han sido citados miles de veces. A menudo colaboraron como coautores en artículos publicados que cubrían temas como un nuevo enfoque para detectar el tráfico de robots de búsqueda o cómo identificar esquemas maliciosos de publicidad web.

“Teníamos muchas ideas, pero siempre estábamos esperando que otras personas las retomasen para convertirlas en realidad. Hablamos de que si nos quedábamos en Microsoft Research un año más, podríamos publicar tres o cuatro artículos al año, pero después de muchos años, uno se desilusiona con ese nivel de impacto”, dice Xie. “Queríamos algo más real”.

También se habían puesto en contacto con ellos investigadores de otras empresas como Yelp, Pinterest y Facebook que habían leído sus artículos y querían colaborar en problemas similares de análisis de datos. Así que en 2013 dieron el salto al mundo empresarial.

“Antes de fundar la empresa, preguntamos a la gente si estábamos preparados”, dice Yu. “La respuesta unánime fue: ‘No, no sabéis lo que os espera’”.

Empezando con sus propios ahorros y conexiones en Silicon Valley, consiguieron un par de clientes iniciales como Yelp, que quería identificar si los usuarios estaban abusando de su sistema con reseñas, y la aplicación china de mensajería instantánea Momo. Cerraron una ronda de Serie A de 14,5 millones de dólares en 2015, el primer dinero externo que consiguieron, y crearon un nicho en la creación de soluciones de seguridad para empresas de Internet de alta tecnología. En 2018, DataVisor recaudó otros 40 millones de dólares liderados por Sequoia China, y alcanzó una valoración de 390 millones de dólares según Pitchbook después de 12 millones más en 2019.

Pero, en el fondo, su mercado se estaba agotando. Si bien DataVisor se centraba en abusar de las promociones que las empresas tecnológicas ofrecían para atraer más usuarios, sus clientes no ofrecían tantas de estas recompensas, lo que normalmente no generaba altas tasas de retención. Al mismo tiempo, las instituciones financieras estaban digitalizando sus sistemas mucho más rápidamente y DataVisor cambió su estrategia para dirigirse a ellas como clientes.

El cambio no fue rápido. Xie dice que se necesitaron dos o tres años para “darle la vuelta a nuestro producto” y hacer que sus algoritmos fueran más integrales, como una ventanilla única para la prevención del fraude. DataVisor recaudó 40 millones de dólares en diciembre de 2022, liderados por Brighton Park Capital, para ayudar en su reinvención. Según Pitchbook, necesitó una valoración más baja de 260 millones de dólares para esa ronda, en un momento en el que el entusiasmo de los inversores por las fintechs estaba decayendo, lo que elevó su financiación total a más de 100 millones de dólares. Forbes estima que los dos fundadores han conservado colectivamente alrededor del 25% de la empresa.

Xie describe el cambio en el sentimiento del mercado en 2022 como una “revisión de la realidad” para ella y su junta directiva después de que el año anterior estableciera un listón alto para las valoraciones. Pero nunca sintió una presión seria para traer gerentes más experimentados para recaudar otra ronda. En cambio, dice que DataVisor terminó con múltiples hojas de condiciones para considerar y eligió asociarse con Brighton Park, una firma de capital de crecimiento con sede en Greenwich, Connecticut, que creyó en su visión a largo plazo.

“Era un momento en el que necesitábamos financiación adicional para pasar al siguiente nivel”, afirma Xie. “Estábamos muy seguros de que todavía teníamos la mejor tecnología del mundo”.

Hasta ahora, la nueva imagen ha sido exitosa. Entre los 50 clientes de DataVisor se encuentran Affirm, una empresa que ofrece servicios de compra inmediata y pago posterior, el banco digital SoFi y el emisor de tarjetas Marqeta. Aunque esa cantidad de clientes es insignificante en comparación con las empresas de verificación de identidad como Persona o Socure, que prestan servicios a miles de empresas, DataVisor promete una relación profunda que abarca todo, desde la incorporación de usuarios hasta el monitoreo de sus transacciones y transferencias bancarias. Los clientes pagan una tarifa de suscripción anual que varía según el volumen de eventos que necesitan que DataVisor procese.

Xie afirma que muchos clientes acuden a DataVisor en busca de consolidar sus esfuerzos de lucha contra el fraude después de descubrir que tratar de integrar a varios proveedores diferentes genera dolores de cabeza e inconsistencias. Ese enfoque integral y de acompañamiento permite a DataVisor cobrar más por cada cliente adicional que la competencia. “Con el tiempo, esperamos que eso nos abra un camino para convertirnos en una empresa mucho más grande”, afirma.

Este artículo fue publicado originalmente por Forbes US.