HoundDog.ai, uma startup que ajuda os desenvolvedores a garantir que seu código não vaze informações pessoalmente identificáveis (PII), saiu do stealth na quarta-feira e anunciou uma rodada seed de $3,1 milhões liderada por E14, Mozilla Ventures e ex/ante, além de um número de investidores-anjo. Ao contrário de outras ferramentas de varredura, o HoundDog realmente analisa o código que um desenvolvedor está escrevendo, usando tanto correspondência de padrões tradicionais quanto modelos de linguagem grandes (LLMs) para encontrar possíveis problemas.
O HoundDog foi fundado por Amjad Afanah, que anteriormente co-fundou o DCHQ, que foi posteriormente adquirido pela Gridstore (que, para complicar as coisas, então mudou seu nome para HyperGrid) em 2016. Afanah também co-fundou o apisec.ai, que ainda está em funcionamento, e trabalhou na startup de veículos autônomos Cruise. A inspiração para o HoundDog veio durante seu tempo na startup de segurança de dados Cyral e conversando com equipes de privacidade lá, ele me disse.
"Quando eu estava na Cyral, tínhamos muitos dados", disse ele. "O que a Cyral faz - como muitos outros no espaço de segurança de dados - é focar em sistemas de produção. Eles ajudam você a descobrir, classificar seus dados estruturados e seus bancos de dados, e depois ajudam você a aplicar controles de acesso. Mas o feedback esmagador que eu continuava ouvindo de equipes de segurança e privacidade era: 'Você sabe, é um pouco reativo e não acompanha as mudanças na base de código.'"
Então o HoundDog avança esse processo ainda mais para a esquerda. Embora ainda esteja no fluxo de integração contínua e ainda não no ambiente de desenvolvimento (embora isso possa acontecer no futuro), a ideia aqui é encontrar vazamentos de dados potenciais antes que o código seja mesclado. E o mais importante, o HoundDog faz isso olhando para o código real, não o fluxo de dados que ele produz. "Nossa fonte de verdade é a base de código", disse Afanah.
Graças a isso, se uma equipe de desenvolvimento começar a coletar números de Seguro Social, por exemplo, o HoundDog levantaria uma bandeira e avisaria a equipe sobre isso antes que o código seja mesclado; também alertaria a equipe de segurança. Isso poderia potencialmente ser um problema importante - e custoso - afinal.
O serviço atualmente suporta código escrito em Java, C#, JavaScript e TypeScript, bem como consultas SQL, GraphQL e OpenAPI/Swagger. O suporte para Python está iminente, diz a empresa.
Afanah observou que uma ferramenta como essa está se tornando especialmente importante nesta era de código gerado por IA, algo que o CEO da Replit (e investidor-anjo do HoundDog) Amjad Masad também ecoou.
"À medida que um número crescente de empresas recorre ao código gerado por AI para acelerar o desenvolvimento, incorporar as melhores práticas de segurança e garantir a segurança do código gerado se torna essencial", disse Masad. "O HoundDog.ai está liderando o caminho na segurança de dados PII no início do ciclo de desenvolvimento, tornando-se um componente indispensável de qualquer fluxo de trabalho de geração de código de AI. Esta é a razão pela qual escolhi investir nesta empresa."
O próprio HoundDog também usa IA. Atualmente, ele se baseia nos modelos da OpenAI para fazer isso, mas é importante enfatizar que isso é opcional. Os usuários que se preocupam com o código saindo de seus repositórios privados também podem optar por confiar apenas no scanner de código mais tradicional da empresa.
Uma parte importante da proposta de valor do HoundDog é que ele pode reduzir os custos de conformidade para startups graças às suas capacidades de relatório automatizado. O serviço pode gerar automaticamente um registro de atividades de processamento (RoPA). Para fazer isso, o HoundDog usa IA generativa para gerar esses relatórios e envia esses dados para a OpenAI. A equipe enfatiza que apenas os tokens descobertos pelo scanner regular são compartilhados com a OpenAI e que o código-fonte real não é compartilhado.
A empresa oferece um plano gratuito limitado, com planos pagos a partir de $200 por mês para escanear até dois repositórios.