Data Services

Somos a sua referência em Big Data & Machine Learning

O que oferecemos?

Somos um estúdio de serviços em Tecnologia da Informação. Nosso propósito é possibilitar que as empresas utilizem seus dados para provocar a melhoria contínua em seus projetos, produtos e processos. Nossas principais competências são: Bancos de Dados, Business Intelligence, Big Data e Machine Learning.

Machine Learning

Com o uso de Dados e Machine Learning, construiremos algoritmos de Inteligência Artificial para resolver problemas complexos

Big Data

Desenvolvemos projetos de Data Warehouse e Data Lake, levando em conta aspectos de utilização, escalabilidade e segurança

Databases

Prestamos serviços de suporte, consultoria e treinamento em bancos de dados PostgreSQL e MySQL

Youtube

Assista aos Webinars e Meetups que já realizamos

Meetup

Entre em nossa comunidade para ficar de olho em nossos próximos Webinars e Meetups

CyberSecurity

Através de nossa parceria com a Kryptus, garanta a segurança de seu ambiente digital

Outros Serviços

Feedbacks

O que nossos clientes dizem sobre nós:

img

A Máquina de Dados possui uma verdadeira parceria com os clientes, conhece a fundo nosso ambiente e possui muita qualidade técnica.

João L. - IT Manager

Posts

Temos orgulho em produzir conteúdo de qualidade e de maneira gratuita para nossos Clientes e o Público em geral

Executive Summary [Janeiro/22]

awesome science trick versus engineering workaround on how to balance two forks on top of a glass

Esta é a Executive Summary, a nossa newsletter para executivos e líderes que gostam de contar com uma curadoria de conteúdo e preferem um formato para ser consumido de maneira objetiva.

Na newsletter de hoje temos 2 tendências muito interessantes para suas estratégias de transformação digital:

Tendência 01/02
Machine Learning Engineering (versus Data Science)

O que é?
Criar modelos matemáticos que encontram padrões nos dados e, com isso, conseguem realizar predições, é o trabalho principal do Data Scientist. A nova tendência é que estes profissionais passem a disponibilizar (via empresas ou diretamente), modelos prontos para o uso em plataformas de Cloud (GCP, AWS, Azure, etc) ou mesmo via um marketplace específico.

Por que isto é interessante?
Com o crescimento desta tendência, as empresas não precisarão mais ter um Data Scientist em suas equipes. Porém, os modelos disponibilizados ainda não são abstratos o suficientes para serem usados por Analistas de Negócio ou Programadores em geral. Por isso a necessidade de Machine Learning Engineer, que é um profissional formado basicamente em Engenharia de Dados, mas com conhecimentos em Data Science. O foco deste profissional será construir a soluções que utilizem os modelos de predição através da construção e monitoramento de Pipelines de Dados.

Como posso colocar em prática?
As principais nuvens já disponibilizam modelos pré-treinados para determinados problemas, alguns inclusive com soluções do tipo “drag-and-drop” (arraste e solte), sem precisar programar. Com isto, sua empresa pode fazer uso de modelos preditivos sem precisar criar uma equipe de Ciência de Dados.

Tendência 02/02
Migração para Nuvem AS-IS: Não faça isso

O que é?
Migrar arquiteturas de dados on premise para a nuvem pode ser uma verdadeida dor de cabeça. Afinal, a quantidade de dados envolvidos pode ser grande, a janela de manutenção pequena e o espaço para erro é inexistente. Por isso, para facilitar, muitas empresas migram as estruturas on prem para a nuvem “as is”, ou seja, mantendo a mesma arquitetura.

Por que isto é interessante?
Migrar para a nuvem não é apenas uma questão de não precisar gerenciar um datacenter. Pode ser muito mais: uso sob demanda, elasticidade sob demanda, separação de storage e processamento, utilização de diferentes serviços sob demanda, etc. Toda esta cartilha de opções está à sua disposição ao migrar para a nuvem, por isto é um bom momento para rever a arquitetura da sua solução para que você possa economizar/explorar/diversificar sua solução com ferramentas que antes não dispunha.

Como posso colocar em prática?
A AWS oferece o “AWS Well Architected Framework” com diversas ideias de arquiteturas para soluções comuns no mundo dos negócios.

Update Sem Where [Dezembro/21]

[Análise]   
E finalmente chegamos ao fim de mais um ano. Se 2021 (se) foi melhor do que 2020, também não podemos nos esquecer que ainda foi um ano com mais desafios ligados à pandemia do que gostaríamos.

Em Dezembro de 2021, ao que me parece, o sentimento da população é muito parecido com o sentimento que existia (a Gestalt) de Dezembro de 2020. À época também acreditávamos ter vencido o vírus, mas todos sabem que a história não foi assim.

Porém, a tendência agora parece ser realmente diferente, a cobertura vacinal ao redor do globo nos dá motivos para acreditar que sim, 2022 será mais parecido com 2019 do que com 2020.

No mundo da tecnologia, dentro do nicho de Dados, nossas apostas vão para projetos voltados cada vez mais para Engenharia de Dados e Big Data. A digitalização das empresas nos últimos 2 anos fizeram com que várias empresas passassem a usar sistemas e a gerar dados, que antes não existiam. Com isso, surge a necessidade de uma cultura que pare para olhar estes dados para que se possa tomar decisões com eles.

Porém, antes disso, a casa terá que ser arrumada. Unir dados de diferentes fontes, criar um catálogo de dados, cuidar da qualidade deles e possui um ambiente com capacidade elástica para processamento serão os desafios das empresas nos próximos anos.

E estaremos junto com você nesta jornada!

Boa leitura!

[Machine Learning & Data Engineering
– Guia prático para ARIMA com PyCaret
Todos os testes estatísticos para uma boa Regressão Linear
– Como fazer tuning de seu modelo de XGBoost
Dez tendências de AI para 2022
– Por quê Machine Learning Engineers estão crescendo mais do que Data Scientists?
Design Patterns para Machine Learning Pipelines
Introdução ao Shap em Python
– A importância do pensamento Bayesiano no dia-a-dia
– Aumentando a acurácia de Computer Vision no Tensorflow
“Dos and Don’ts” de um Data Scientist

[Amazon Web Services]  
Novas Features para o comando COPY no Redshift, para facilitar o dia do Data Engineer
Gerenciando dados pessoais de maneira automatizada na AWS
– AWS anuncia reduçãode até 31% nos custos de algumas classes do S3
– Criando uma Arquitetura de Data Mesh (Pub/Sub) na AWS
– AWS oferece serviço de consultoria para migração de dados com o Data Migration Accelerator
– Os benefícios de utlizar “in-memory” cache

[Microsoft Azure]  
– Como implementar AI responsavelmente
– Microsoft é definida como líder no Quadrante Gartner de DBMSs
– Azure aumenta seu conteúdo para processamento Geoespacial
– 5 Razões para usar o Azure Databricks

[Google Cloud Platform]  
Melhores posts sobre AI na GCP em 2021
Tendências que a GCP levantou junto a seus clientes em 2021
– Como lidar com o Log4J na GCP
– Principais novidades da GCP em Dezembro
– Utilizando o Contact Center AI para melhorar o relacionamento com clientes

[Postgres]  
– Lançada nova versão do DBComparer, que analise sincroniza o DDL de diferentes Postgres
– Nova versão lançada do Conversor de DB MySQL to Postgres

[MySQL]  
– Implementando soluções de Disaster Recovery com MySQL
– Recap da Oracle Database World
Usando o HeatWave para acelerar a criação de Insights

[MongoDB]  
– Sinais de que sua Arquitetura de Dados está limitando seu crescimento: Parte 1
– Sinais de que sua Arquitetura de Dados está limitando seu crescimento: Parte 2
– Análise de dados com Interactive Filtering
Exportando queries usando o VS Code