Blog - Page 6 of 9 - Máquina de Dados

Driven by Data #06: State of PostgreSQL

Venha saber mais sobre este banco de dados que, além de open source, permite uso comercial, é robusto e está há mais de 30 anos mercado: o PostgreSQL!

Link: https://youtu.be/LQEU4cHBi2M

Executive Summary #09: State of Postgres

[Briefing]
Esta é a Executive Summary, a nossa curadoria de conteúdo para executivos e líderes que são shareholders em projetos de Data & AI.

Além deste conteúdo, temos também uma newsletter técnica chamada Update Sem Where e o nosso podcast Driven By Data.

Na edição deste mês da Executive Summary temos apenas 1 tendência: os insights da pesquisa State Of Postgres.

Abaixo, o nosso resumo executivo:

Tendência 01/01
State of Postgres

O que é?
A State of Postgres é uma pesquisa conduzida pela Timescale, empresa por trás do TimescaleDb, que é um banco de dados baseado em Postgres. A pesquisa é global e demonstra a maturidade do ecossistema Postgres (que agora em 2022 está completando 33 anos da sua primeira versão).

Por que isto é interessante?
Estamos falando do banco de dados open source mais robusto e longevo do mundo. Utilizado por startups iniciantes, startups unicórnio (inclusive aqui no Brasil), pequenas, médias e grandes corporações (mais dados aqui). Isto significa que sua empresa pode ter acesso a um banco de dados completo, gratuito e cuja licença open source permite o uso comercial do mesmo.

Como posso colocar em prática?
Incentive o uso do Postgres por sua equipe. A pesquisa State of Postgres demonstra as principais Extensões e Third Party Tools utilizadas, ajudando seu time a construir soluções com toda a qualidade, confiança e maturidade que se espera de um banco de dados.

Update Sem Where #51

[Briefing]
Você está lendo a Update Sem Where, nossa newsletter técnica, lançada mensalmente e que contém as principais novidades dos últimos 30 dias no mundo de Data & AI.

Além deste conteúdo, temos também uma newsletter para líderes chamada Executive Summary e o nosso podcast Driven By Data.

Fiquem agora com a Update Sem Where!

[Análise]
Continuamos a acreditar na educação como ferramenta para a evolução pessoal e profissional (mais sobre este assunto na newsletter anterior).

Com isso, não nos parece coincidência que agora é a vez da AWS oferecer um pacote de subscription para sua plataforma de Digital Training, a AWS Skill Builder (mais sobre os planos aqui).

Reforçamos nossa análise de que, se você deseja entrar para a área de tecnologia, a hora é agora!

Em termos de novidades, a estrela do mês é a sessão de Bancos de Dados, com muitas novidades legais no mundo Postgres!

Boa leitura!

[Data Engineering & Machine Learning]
– Pirâmide da qualidade de dados
– Como interagem Data Engineers e Data Scientists em um time de alta performance
– As 5 coisas mais difíceis de se fazer em SQL
– Todos os algoritmos de Machine Learning explicados em menos de 1 minutos cada
– Como fazer detecção de movimento em Python
– Processamento paralelo de arquivos grandes em Python
– Desmistificando o arquivo Parquet
– Como fazer melhores testes de hipótese
– Personas dos usuários das plataformas de dados
– Métricas para incerteza em regressões

[Amazon Web Services]
– Novos planos de assinatura do Skill Builder, a plataforma de treinamentos
– Lançado o Neptune Global Graph Database
– Disponibilizada a Detecção de Anomalia no Devops Guru
– Disponibilizados mais tiers de preço no Lambda

[Microsoft Azure]
– Azure é declara a nuvem líder pela Gartner
– Análise de Mercado com o Microsoft Threat Intelligence Solutions
– Governança de Dados com o Microsoft Purview
– Lançado o Azure Managed Grafana

[Google Cloud Platform]
– Nivele suas data skills
– Segurança na nuvem para CISOs
– Gerenciando a nuvem com Active Assist

[Databases]
– Postgres: pg_jsonschema faz validação de json
– Postgres: Benchmark entre AlloyDB (Pg na Google) e Postgres
– Postgres: Particionamento com pg_partman
– Postgres: Melhorias nas Functions no PG14
– Postgres: Analisador automático de sugestão índices
– Postgres: Resultados da pesquisa STATE OF POSTGRES
– Postgres: Debugging de problemas com autovacuum
– Postgres: dbGate, novo GUI para bancos de dados
– Postgres: Bancos de dados de séries temporais, o que são?
– Postgres: PAGILA, um banco de dados de exemplo para Postgres

Driven by Data #05: Employer University

Você sabe o que é Employer University?

Não?

Então venha descobrir e, de quebra, quem sabe você não muda sua carreira para sempre?

Assista ao mais novo episódio do Driven by Data!

[] ‘s

Update Sem Where #50

[Análise]
Não é surpresa para ninguém que o mercado de tecnologia possui falta de mão de obra qualificada. E não é apenas no Brasil!

A crescente digitalização das empresas (em parte impulsionada pela pandemia) e a grande tendência de permitir o trabalho remoto (também em grande parte impulsionada pela pandemia), fez com que a competição por talentos, antes baseada na localização, se torna-se uma luta global e desigual por talentos.

Global pois remota e desigual pois, com o real desvalorizado frente a outras moedas, fica muito fácil para empresas extrangeiras conseguirem atrair candidatos com salários exorbitantes, se convertidos para o Real, mas que na moeda de origem, podem representar menos do que se pagaria a um profissional morando naquele país. Ganha-ganha para quem contrata e para quem é contratado.

No Brasil temos como defesa, e aqui com um tom de ironia, o fato de que cerca de 95% da população não fala inglês, que é a língua utilizada pelas empresas que contratam remotamente, mesmo que não sendo Norte-Americanas ou Inglesas. Sabe quando na entrevista de emprego te perguntam um defeito e você pensa em responder um defeito que seja uma qualidade (alô “perfeccionismo”)? Então, é mais ou menos por aí.

Porém, internamente, temos nossa própria batalha de talentos. Por isso, cada vez mais as empresas investem em cursos de formação, já visando contratar os com melhor desempenho.

Só neste mês temos mais de 5 mil vagas para cursos, vindas de empresas como Microsoft, Itaú e ciandt.

Não fique de fora. O mercado de tecnologia está aquecido e, se você planeja trocar de área para entrar na tecnologia, o momento é agora.

“Ah, mas tecnologia não é só para geeks?”, pode perguntar uma pessoa qualquer. Não, não é. Assim como a Medicina, a área de Tecnologia possui diversas especializações, indo de Vendas até Fabricação de Hardware, passando por Codificação, Gestão de Projetos, etc.

Não é um mercado fácil, pois você tem que estar sempre se atualizando. Mas, nada que vale a pena na vida é fácil. E é melhor enfrentar desafios estando empregado e, possivelmente, sendo bem pago, do que o contrário.

Boa leitura e boa sorte!

[Data Engineering & Machine Learning]
– Tag-based access control for modern data architectures
– Construa uma Arquitetura Data Mesh com AWS Lake Formation e Glue
– Release do Airflow 2.3.0
– PyCaret 3.0 lançado!
– MLOps em 10 minutos
– Microsoft oferece 5 mil vagas gratuitas em capacitação
– ciandt abre vagas para curso gratuito de capacitação
– Itaú oferece vagas gratuitas para curso de capacitação
– Operacionalizando Machine Learning em 10 passos
– PyDon’ts: Ebook com melhores práticas para codificação em Python

[Amazon Web Services]
– Agora é possível criar Jobs Visuais no AWS Glue Studio
– AWS Glue Interactive Sessions permite o uso de notebooks no Glue
– AWS Athena adiciona conectores aos principais concorrentes
– Redshift agora possui integração com Microsoft Azure AD e PowerBI
– AWS MSK lançado, tornando o Kafka As A Service disponível

[Microsoft Azure]
– Utilize a Plataforma Power para construir soluções Low Code
– Lançado o Azure Health Data Services
– Microsoft libera a Feature Store do Linkedin

[Google Cloud Platform]
– Lançada a nova plataforma AlloyDb
– Links para as diversas sessions workshops gravadas no Google I/O
– Resumo de algumas novidades anunciadas no Google I/O
– Utilização de Machine Learning para melhorar o trabalho remoto
– Lançado o Big Query BI Engine!
– GCP lança o whitepaper The Future of Data
– Participe do Google Cloud Applied ML Summit
– Google lança o Cost Esmimator chamado GKE

[Databases]
– Postgres: Parquet e Postgres em um Data Lake
– Postgres: Monitoramento de query com pg_stat_statements
– Postgres: Entenda sua carga com pg_stat_monitor
– Postgres: Um guia para migrações com zero downtime
– Postgres: Analisando o IO do Postgres
– Postgres: Fazendo tuning do auto-vacuum

Driven by Data #04: KPIs que Todo Time de Dados deveria usar

Neste episódio elencamos alguns dos KPIs mínimos que TODO time de dados deveria usar para melhorar a governança do seu ambiente.

Executive Summary #07: Indústria 4.0

Esta é a Executive Summary, a nossa newsletter para executivos e líderes que gostam de contar com uma curadoria de conteúdo e preferem um formato para ser consumido de maneira objetiva.

Na newsletter de hoje temos 3 tendências muito interessantes para suas estratégias de transformação digital:

Tendência 01/03
Indústria 4.0 é mais do que Fábrica 4.0

O que é?
Esta dica é baseada no artigo de mesmo nome do Silvio Meira, que você pode encontrar aqui. De maneira geral as empresas têm utilizado as novas tecnologias para digitalizar as fábricas “Mas o paradigma e o modelo mental de quase toda a indústria, [quase] até agora, ainda é definido pela linha de montagem móvel e a produção em massa, fenômeno secular, associado a Ford e “sua” linha de montagem de 1913 em Highland Park”.

Por que isto é interessante?
Segundo o autor há muito mais a explorar pois “Acontece que digitalização não muda fundamentos da criação, entrega e captura de valor; é apenas codificação de processos de suporte aos fundamentos, por um lado, e interfaces digitais de controle dos processos e uso de artefatos, por outro.”

Como posso colocar em prática?
Leia o artigo do Silvio Meira e implemente a verdadeira Transformação Digital da Indústria 4.0

Tendência 02/03
(In)Equidade de Gênero na Área de Dados

O que é?
Segundo a mais recente pesquisa State Of Data , apesar das mulheres serem 49% da população brasileira, elas são apenas 23,3% das profissionais em níveis de entrada na área de dados e apenas 13% nos níveis de gestão.

Por que isto é interessante?
Combater as diversas formas de preconceito presentes em nossa sociedade é algo muito importante para a qualidade de vida e produtividade das pessoas, o que possui impacto direto no faturamento das empresas.

Como posso colocar em prática?
Este é um tema muito grande para esta newsletter, mas começar a conhecer os dados da sua própria empresa pode ajudar a propor políticas para melhorar os indicadores definidos.

Tendência 03/03
Investimento privado em IA de 2021 é o dobro de 2020

O que é?
A mais recente pesquisa global AI Index Report traz um número muito interessante: o investimento privado em IA dobrou em 2021 (em relação a 2020), e também existe um número recorde de novas startups com soluções baseadas em IA.

Por que isto é interessante?
A concorrência é interessante para o mercado, pois torna as soluções mais acessíveis, além de permitir que players atuem em nichos específicos, podendo possuir soluções prontas para seus problemas e/ou oportunidades a serem exploradas.

Como posso colocar em prática?
Analisar o ecossistema de inovação de sua região pode trazer novos parceiros, que ajudaram você a atingir seus objetivos estratégicos.

Update Sem Where [Março/2022]

[Análise]
O mercado de Data possui importantes relatórios lançados ao longo do ano.

Neste mês, tivemos o lançamento de dois deles: Artificial Intelligence Index Report (escopo global) e o State of Data (escopo Brasil). Aproveite e se atualize sobre o estado do mercado!

O ritmo de novidades tecnológicas diminuiu um pouco, com as empresas guardando o seu melhor para os diversos eventos ao longo do ano, ótimo momento para reler as últimas newsletters e implementar as mudanças que ficaram no backlog.

Boa leitura!

[Big Data & Machine Learning]
– From zero to hero: Uma jornada de Data Analyst a Engenheiro Sênior
– Lançado o relatório Artificial Intelligence Index Report 2022
– Indústria 4.0 é muito mais do que Fábrica 4.0
– State of Data Brasil lançado
– Usando AutoEncoders em Redes Neurais Não Supervisionadas
– Descobrindo Partículas de Informação com a Teoria de Shannon
– O que Data Scientists podem aprender com Economistas
– Características de Séries Temporais
– KPIs que todo Time de Dados deveria ter

[Amazon Web Services]
– Lançado o novo AWS QuickSight Community
– AWS Lambda agora suporta 10GB de storage efêmero
– PostgreSQL RDS agora suporte FDW para MySQL
– RDS MySQL & PostgreSQL MultiAZ Deployment

[Microsoft Azure]
– Lançado o Azure Health Data Services para execução de algoritmos de IA
– Microsoft Azure nomeada como Líder no Quadrante da The Forrester
– Introduzindo o Azure Synapse para o Dataverso
– Novidades na PaaS Azure Stream Analytics

[Google Cloud Platform]
– Federated Learning na GCP
– Uso de NLP na Google Cloud para geração de insights
– Criado repositório de análise de log, com foco em Dados e Segurança
– Economizando com Cloud Spanner
– Pipeline de dados do SAP para BigQuery com Cloud Cortex

[Databases]
– Flyway: Versionamento de objetos e criação de scripts
– Postgres: Usando plprofiler para testar performance do banco de dados
– Postgres: Fazendo tuning de max_wal_size
– Postgres: Realizando sharding do banco de dados
– Postgres: Automatizando testes no banco de dados com pgTAP
– Postgres: Análise de uso de JSON em Postgres

Home