Betterdata utiliza datos sintéticos para proteger datos reales
Mejores datos, una startup con sede en Singapur que utiliza datos sintéticos programables para proteger datos reales, anunció hoy que ha recaudado 1,55 millones de dólares. La ronda, que dijo que tenía un exceso de solicitudes, fue dirigida por Investible con la participación de Franklin Templeton, Xcel Next, la Universidad de Tecnología y Diseño de Singapur, Bon Auxilium, Tenity, Plug and Play y Entrepreneur First.
La startup a été fondée en 2021 par le Dr Uzair Javaid, son PDG, et le technologue en chef Kevin Yee, dans le but de rendre le partage de données plus rapide et plus sécurisé à mesure que les réglementations sur la protection des données augmentaient dans el mundo. Actualmente, la empresa tiene asociaciones de investigación y desarrollo con dos importantes universidades de Singapur y Estados Unidos (no puede revelar públicamente quiénes son) y cuenta con el Shanghai Pudong Development Bank entre sus clientes.
Betterdata dice que es diferente de los métodos tradicionales de intercambio de datos que utilizan la anonimización de datos para destruir datos, porque en su lugar utiliza inteligencia artificial generativa e ingeniería de privacidad.
Yee le explicó a TechCrunch que los datos sintéticos programáticos usan modelos generativos, como modelos de aprendizaje profundo, incluidos modelos antagónicos generativos usados en deepfakes, transformadores usados en ChatGPT y modelos de difusión usados en difusión estable, para crear y aumentar nuevos conjuntos de datos.
Estos conjuntos de datos sintéticos tienen características y estructuras similares a los datos del mundo real sin revelar información confidencial o privada sobre las personas.
“La idea es crear una versión simulada de un conjunto de datos real que se pueda usar de manera segura para una variedad de propósitos, incluida la protección de datos confidenciales, la reducción de sesgos y la mejora de los modelos de aprendizaje automático”, declaró.
Los datos sintéticos programáticos ayudan a los desarrolladores de varias maneras. Algunos ejemplos incluyen ayudarlos a proteger datos confidenciales, cumplir con las regulaciones de protección de datos como GDPR e HIPAA, aumentar la disponibilidad de datos entre equipos, crear más datos para entrenar, probar y validar modelos de aprendizaje automático y abordar problemas de desequilibrio de datos mediante la creación de más registros para grupos subrepresentados. . o curso.
La financiación de Betterdata se utilizará para el lanzamiento de su producto y para mejorar su pila de tecnología de datos sintéticos programables, incluida la compatibilidad con conjuntos de datos de una sola tabla, varias tablas y series temporales. Son diferentes variaciones de conjuntos de datos tabulares y Yee explica que las principales diferencias son sus estructuras y los problemas para los que fueron creados.
Par exemple, les ensembles de données à table unique se concentrent sur des tables autonomes, tandis que les ensembles de données à plusieurs tables sont destinés à prendre en compte les relations entre plusieurs tables, et les ensembles de données de séries chronologiques traitent des données collectées a lo largo del tiempo.
Betterdata también planea contratar a más personas, incluidos empleados de ventas y marketing, y expandirse más allá de Singapur a más de la región de Asia-Pacífico durante los próximos dos años.
En un comunicado sobre la inversión de Investible, el director Khairu Rejal dijo: «Betterdata resuelve uno de los mayores problemas que enfrenta la industria de la IA en la actualidad: la falta de datos de alta calidad que también cumplan con los requisitos de confidencialidad. A través de su poderosa plataforma, Betterdata genera datos sintéticos que imitan los datos del mundo real sin comprometer la calidad y la privacidad, ayudando a las empresas a cumplir con las leyes de privacidad y cumplimiento global a escala.