“Tony Stark conseguiu construir isso em uma caverna! Com uma caixa de sucata!”
-Citação do filme “Homem de Ferro”
🤣Trazendo uma perspectiva humorística pro assunto da DeepSeek
Caso você tenha estado em uma caverna (sem o Tony Stark) nos últimos dias, talvez você tenha perdido este assunto, então aqui vai um resumo:
– A empresa chinesa DeepSeek AI lançou um modelo de LLM que rivaliza com e supera os principais modelos do mercado, dentre eles o OpenAI o1
– O modelo foi liberado de maneira open source, quem quiser pode usar gratuitamente
– O custo de treinamento do modelo foi (segundo afirmação da própria empresa) de apenas US$ 6MM (contra US$ 600MM da OpenAI)
– Um milhão de tokens na DeepSeek custa US$ 4 (contra US$ 100 na OpenAI)
– Tanta eficiência foi conseguida por um modelo mais eficiente e um melhor tratamento de dados
– Essa eficiência foi buscada pois a China está sofrendo restrições impostas pelos EUA em relação aos tipos de placas Nvidia que podem ser exportadas pra lá (basicamente, apenas os modelos mais antigos)
Existe uma frase que diz: “life finds a way”. Pelo visto, o mesmo acontece com a criatividade humana quando (ou principalmente quando) existem restrições impostas
Em uma referência mais pop/geek mas tão filosófica quanto:
“Tony Stark conseguiu construir isso em uma caverna! Com uma caixa de sucata!”