Dúvida entre montar um time interno ou contratar uma solução especializada para estrututar os dados de produtos?

10 de jul. de 2025

Em algum momento, todo e-commerce e marketplace se depara com uma pergunta inevitável: Como estruturar os dados dos produtos comercializados de forma confiável e escalável? 

É aí que começa a dúvida entre montar um time interno ou contar com uma solução especializada como a Koya.

1.Contruir time de data sciente dentro de casa

Na prática, criar uma equipe interna em ciência de dados e machine learning pode parecer a opção mais direta, mas esconde uma curva de aprendizado longa e cara. Existe um custo elevado de contratação profissionais qualificados, tempo necessário para que o time entenda as nuances da operação e que entregue o resultado esperado. Esse resultado é especialmente crítico no digital, onde o erro se traduz diretamente em perda de vendas, devoluções e quebra de confiança. 

A pergunta a ser feita é: Essa é uma área core da empresa, que eu vou colocar tempo e recursos em detrimento de outras frentes? 

2. Contruir time operacional dentro de casa

Há também quem opte por resolver o problema com times mais operacionais, fazendo o trabalho manualmente. Essa abordagem funciona no curto prazo, mas não escala. Cada analista vai interpretar as informações de forma diferente, o turnover costuma ser alto e o resultado é inconsistente. Se dados de produto for um problema pontual, pode resolver, mas se a empresa está crescendo e a quantidade de produtos diferentes também, uma hora as inconsisencias vão gritar e o tive vai ter que ter um tamanho muito grande para comportar o volume.

3. Terceirizar time operacional

Outro caminho comum é terceirizar o trabalho operacional para empresas que alocam mão de obra em países de menor custo. Mas, nesse modelo, a qualidade costuma ser um maior gargalo do que contratar um time operacional interno, com problemas de idioma, pouca padronização e quase nenhum aprendizado acumulado.

A importância da acurária ao tratar dados de produtos

Quando falamos de dados de produto, a variável mais crítica é a acurácia. Com a popularização dos LLMs como o ChatGPT, muitos se perguntam:


"Por que não usar essas ferramentas para extrair ou gerar atributos?"

E a resposta é simples:

Porque 60-70% de acurácia, que é o que esses modelos costumam entregar em contextos genéricos, não é suficiente para e-commerce.

Isso significa que 3 em cada 10 atributos estarão errados e pior, o modelo não te mostra quais. Ele pode “alucinar” um dado incorreto com total confiança, como informar que um iPhone tem mais memória do que realmente possui. O resultado disso é uma nova cadeia de problemas que impacta diretamente o caixa e o cliente.

Na Koya, nosso foco é justamente resolver isso com precisão. Nossos modelos são próprios, treinados com regras específicas para cada segmento e com validação contínua. Isso nos permite entregar resultados com mais de 95% de acurácia, mesmo em categorias complexas. É o que fazemos hoje para indústrias como autopeças, CPGs, cannabis, materiais de construção e equipamentos esportivos, entre outras. E estamos sempre expandindo. 

Se o seu catálogo tem milhares ou milhões de produtos, o problema de dados não é algo que pode ser resolvido com um script ou um prompt bem escrito. É um desafio estrutural e é exatamente para isso que eu criei a Koya.