{"id":1327,"date":"2026-01-21T17:10:12","date_gmt":"2026-01-21T20:10:12","guid":{"rendered":"https:\/\/www.tachyonix.io\/br\/?p=1327"},"modified":"2026-01-21T17:10:13","modified_gmt":"2026-01-21T20:10:13","slug":"o-modelo-de-ia-da-sap-sap-rpt-1-e-um-projeto-de-pesquisa-nao-uma-revolucao","status":"publish","type":"post","link":"https:\/\/www.tachyonix.io\/br\/o-modelo-de-ia-da-sap-sap-rpt-1-e-um-projeto-de-pesquisa-nao-uma-revolucao\/","title":{"rendered":"O modelo de IA da SAP, &#8220;sap-rpt-1&#8221;, \u00e9 um projeto de pesquisa, n\u00e3o uma revolu\u00e7\u00e3o"},"content":{"rendered":"\n<p>OS FATOS<\/p>\n\n\n\n<p>Esta semana, a SAP celebra o TechEd, sua confer\u00eancia anual de tecnologia.<\/p>\n\n\n\n<p>Um dos an\u00fancios foi a estreia da divis\u00e3o de pesquisa da SAP no mundo da IA, com a publica\u00e7\u00e3o de um novo artigo na confer\u00eancia NeurIPS chamado \u201cConTextTab\u201d. O c\u00f3digo est\u00e1 dispon\u00edvel em um reposit\u00f3rio chamado sap-rpt-1-oss.<\/p>\n\n\n\n<p>O CTO da SAP, Phillipp Herzig, anunciou a novidade em uma postagem no blog que vale a pena conferir. O objetivo da SAP \u00e9 criar uma IA \u201ccom reconhecimento sem\u00e2ntico\u201d capaz de entender e fazer previs\u00f5es a partir de dados tabulares. Justo.<\/p>\n\n\n\n<p>O CEN\u00c1RIO<\/p>\n\n\n\n<p>O principal desafio da IA \u200b\u200bcom dados tabulares \u00e9 que os modelos atuais, que chamamos de Modelos de Linguagem Lingu\u00edstica (LLMs), foram criados a partir da inova\u00e7\u00e3o de 2017 do Google e seu \u201cMecanismo de Aten\u00e7\u00e3o\u201d, ou seja, a constru\u00e7\u00e3o de Redes Neurais baseadas nas rela\u00e7\u00f5es entre as entidades. Isso funciona bem com dados lingu\u00edsticos, como express\u00f5es idiom\u00e1ticas ou linguagens de programa\u00e7\u00e3o.<\/p>\n\n\n\n<p>Nada disso se aplica a dados tabulares. Dados tabulares ainda s\u00e3o um dom\u00ednio mais cl\u00e1ssico de aprendizado de m\u00e1quina, mas alguns avan\u00e7os est\u00e3o surgindo nessa \u00e1rea, e a SAP tamb\u00e9m est\u00e1 nessa onda. Essencialmente, com dados tabulares, voc\u00ea precisa decidir se vai se concentrar em:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Estrutura eficiente: Modelos como TabPFN ou TabICL s\u00e3o &#8220;nativos de tabelas&#8221;. Eles s\u00e3o constru\u00eddos para processar com efici\u00eancia as linhas e colunas de uma tabela, mas geralmente s\u00e3o treinados com dados sint\u00e9ticos. Eles veem n\u00fameros e padr\u00f5es, mas n\u00e3o t\u00eam ideia do que esses n\u00fameros significam.<\/li>\n<\/ol>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Significado sem\u00e2ntico: Modelos baseados em Grandes Modelos de Linguagem (LLMs) entendem a linguagem. Eles sabem que uma coluna chamada &#8220;Pre\u00e7o ($)&#8221; se refere a dinheiro ou que &#8220;Laptop&#8221; \u00e9 um tipo de computador. Mas s\u00e3o ineficientes e t\u00eam dificuldade em analisar mais do que algumas dezenas de linhas por vez.<\/li>\n<\/ul>\n\n\n\n<p>Ent\u00e3o, a SAP surge e diz: vamos construir o ConTextTab e unificar os dois mundos, um modelo nativo de tabelas (portanto, eficiente), mas projetado especificamente para ser &#8220;compreensivo \u00e0 sem\u00e2ntica&#8221;. Ele usa incorpora\u00e7\u00f5es especiais para entender o significado dos cabe\u00e7alhos das colunas e dos valores de texto nas c\u00e9lulas.<\/p>\n\n\n\n<p>My TEST Results<\/p>\n\n\n\n<p>SAP-RPT-1 Model Validation Report: API Endpoint: https:\/\/rpt.cloud.sap\/api\/predict<\/p>\n\n\n\n<p>The model demonstrates significant limitations in pattern recognition, semantic understanding, and handling of edge cases.<\/p>\n\n\n\n<p>Semantic Confusion \u2014 Confuses data types and feature relevance<\/p>\n\n\n\n<p>Contradictory Data Handling \u2014 Poor behavior with conflicting information<\/p>\n\n\n\n<p>Business Logic Limitations \u2014 Cannot handle complex SAP business rules<\/p>\n\n\n\n<p><strong>Test Results Overview<\/strong><\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"886\" height=\"224\" src=\"https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-10.png\" alt=\"\" class=\"wp-image-1328\" srcset=\"https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-10.png 886w, https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-10-300x76.png 300w, https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-10-768x194.png 768w\" sizes=\"auto, (max-width: 886px) 100vw, 886px\" \/><\/figure>\n<\/div>\n\n\n<p>1. Problemas Fundamentais de Reconhecimento de Padr\u00f5es<\/p>\n\n\n\n<p>O modelo falha na correspond\u00eancia b\u00e1sica de padr\u00f5es tabulares<\/p>\n\n\n\n<p>N\u00e3o consegue aprender mapeamentos determin\u00edsticos de forma confi\u00e1vel<\/p>\n\n\n\n<p>2. Defici\u00eancias na Compreens\u00e3o Sem\u00e2ntica<\/p>\n\n\n\n<p>N\u00e3o consegue distinguir tipos de dados (c\u00f3digos vs. IDs)<\/p>\n\n\n\n<p>N\u00e3o compreende a relev\u00e2ncia das caracter\u00edsticas<\/p>\n\n\n\n<p>Trata todas as colunas como igualmente importantes<\/p>\n\n\n\n<p>3. Complexidade de Aprendizagem Limitada<\/p>\n\n\n\n<p>N\u00e3o consegue lidar com intera\u00e7\u00f5es entre m\u00faltiplas caracter\u00edsticas<\/p>\n\n\n\n<p>Utiliza padr\u00f5es simples e lineares por padr\u00e3o<\/p>\n\n\n\n<p>Insuficiente para a complexa l\u00f3gica de neg\u00f3cios da SAP<\/p>\n\n\n\n<p>Outros testes foram bem-sucedidos; foco apenas nas falhas, principalmente relacionadas \u00e0 arquitetura do modelo.<\/p>\n\n\n\n<p>MINHA OPINI\u00c3O<\/p>\n\n\n\n<p>Antes de abordarmos o novo modelo da SAP, precisamos entender por que os dados tabulares (pense em tabelas de banco de dados 2D) representam um desafio t\u00e3o singular para a IA. Onde j\u00e1 tentamos isso e falhamos no passado.<\/p>\n\n\n\n<p>Os dados tabulares s\u00e3o estruturados. Seu significado deriva da rela\u00e7\u00e3o r\u00edgida entre linhas e colunas, mas frequentemente carecem da &#8220;estrutura inerente&#8221; da linguagem natural. Ter um &#8220;5&#8221; na linha da coluna &#8220;Product_Rating&#8221; significa algo completamente diferente do mesmo &#8220;5&#8221; na coluna &#8220;Quantity&#8221;, e os modelos de IA historicamente t\u00eam dificuldades com esse contexto. Sem mencionar que a linha abaixo pode ser id\u00eantica, mas com um d\u00edgito diferente, o que torna a chave \u00fanica diferente.<\/p>\n\n\n\n<p>Sem mencionar que as tabelas s\u00e3o atualizadas e os dados tamb\u00e9m, enquanto os Modelos de Aprendizagem Baseados em L\u00f3gica (LLMs) foram treinados com livros, textos ou imagens est\u00e1ticas.<\/p>\n\n\n\n<p>Dito isso, se voc\u00ea quiser resolver esse problema, pode categorizar os modelos tabulares, tamb\u00e9m chamados de Modelos de Aprendizagem Baseados em L\u00f3gica (LTMs), em dois blocos;<\/p>\n\n\n\n<p>1. \u00c1rvores de Decis\u00e3o com Gradiente Impulsionado<\/p>\n\n\n\n<p>Esses n\u00e3o s\u00e3o modelos de aprendizado profundo, mas as \u00c1rvores de Decis\u00e3o com Gradiente Impulsionado, como os modelos XGBoost ou CatBoost, s\u00e3o modelos tradicionais de aprendizado de m\u00e1quina. Por tradicional, quero dizer que exigem treinamento separado para cada conjunto de dados.<\/p>\n\n\n\n<p>Voc\u00ea precisa de dados altamente selecionados, muita capacidade computacional e uma excelente equipe de engenheiros de aprendizado de m\u00e1quina para que funcionem.<\/p>\n\n\n\n<p>2. Usar Modelos de Aprendizado de M\u00e1quina Llama (LLMs)<\/p>\n\n\n\n<p>A outra categoria \u00e9 usar um LLM de prop\u00f3sito geral, como o Llama, que \u00e9 Open Weights, e simplesmente alimentar as tabelas. Os resultados s\u00e3o ruins porque:<\/p>\n\n\n\n<p>Janelas de Contexto Limitadas: Os LLMs t\u00eam um limite r\u00edgido de quanto texto podem ler de uma vez (a &#8220;janela de contexto&#8221;). Isso significa que eles podem analisar apenas 32 ou 64 linhas dos seus dados, o que \u00e9 in\u00fatil para uma tabela com milhares de entradas.<\/p>\n\n\n\n<p>A Arquitetura Inadequada: Os LLMs s\u00e3o projetados para texto sequencial, n\u00e3o para a estrutura 2D de uma tabela. Eles n\u00e3o s\u00e3o eficazes no processamento de valores num\u00e9ricos.<\/p>\n\n\n\n<p>O que a pesquisa est\u00e1 tentando agora: Modelos de base &#8220;nativos de tabela&#8221;<\/p>\n\n\n\n<p>Devido \u00e0s limita\u00e7\u00f5es dos GBDTs (aus\u00eancia de pr\u00e9-treinamento) e LLMs (arquitetura inadequada), a pesquisa tem se voltado para os &#8220;modelos de base nativos de tabela&#8221;.<\/p>\n\n\n\n<p>Esses modelos s\u00e3o projetados para aprender com diversas tabelas e, em seguida, aplicar esse conhecimento a novas tabelas n\u00e3o vistas, usando aprendizado contextual (ICL). Essencialmente, \u00e9 o seguinte:<\/p>\n\n\n\n<p>O que a Snowflake e a Databricks tentaram (e que poucos se importam).<\/p>\n\n\n\n<p>Isso foi tentado e explicado nesta postagem do blog.<\/p>\n\n\n\n<p>\u00c9 aqui que entram os novos modelos, incluindo o da SAP, com o ConTextTab.<\/p>\n\n\n\n<p>Repito: o problema com os modelos sint\u00e9ticos \u00e9 que eles ignoram o significado rico dos nossos dados.<\/p>\n\n\n\n<p>O ConTextTab da SAP busca solucionar esse problema; \u00e9 um modelo &#8220;nativo de tabela&#8221;, como o TabICL (portanto, eficiente), mas adiciona um novo ingrediente crucial:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>compreens\u00e3o sem\u00e2ntica. Em vez de dados sint\u00e9ticos, ele \u00e9 treinado em um grande conjunto de dados (p\u00fablico). \u00d3TIMO!<\/li>\n<\/ol>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Ele usa codificadores especializados para entender diferentes tipos de dados, incluindo texto, datas e n\u00fameros. FANT\u00c1STICO!<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li>AL\u00c9M DISSO, ele l\u00ea os nomes das colunas para entender o contexto, EXCELENTE!<\/li>\n<\/ul>\n\n\n\n<p>Esta \u00e9 a nova fronteira: criar modelos que sejam t\u00e3o eficientes quanto os GBDTs e t\u00e3o &#8220;inteligentes&#8221; em rela\u00e7\u00e3o \u00e0 linguagem quanto os LLMs, tudo isso constru\u00eddo especificamente para a estrutura de uma tabela. Acho que isso pode funcionar!<\/p>\n\n\n\n<p>MAS<\/p>\n\n\n\n<p>\u00c9 aqui que entro com a cr\u00edtica, especialmente porque tentamos e falhamos aqui, e j\u00e1 faz um ano desde que soubemos que a SAP estava seguindo nessa dire\u00e7\u00e3o, removendo a narrativa de marketing.<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>N\u00e3o foi treinado com dados da SAP: O artigo deixa bem claro que o ConTextTab foi pr\u00e9-treinado no conjunto de dados T4. Este \u00e9 um grande conjunto de dados p\u00fablico de tabelas coletadas da internet, n\u00e3o um conjunto de dados espec\u00edfico da SAP. Isso \u00e9 ruim, porque a primeira coisa em que falhamos quando quer\u00edamos fazer algo real foi descobrir que os conjuntos de dados da SAP n\u00e3o existem, e eu me perguntava: &#8220;Espero que a SAP, em algum momento, crie um modelo de IA e publique os conjuntos de dados nos quais ele foi treinado&#8221;, o que inclui o S\/4HANA ou mesmo o ECC. Bem, presumo que n\u00e3o hoje.<\/li>\n<\/ol>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Foi avaliado em outros benchmarks p\u00fablicos, como CARTE e OpenML. N\u00e3o h\u00e1 indica\u00e7\u00e3o de que quaisquer dados corporativos valiosos da SAP tenham sido usados \u200b\u200bpara a avalia\u00e7\u00e3o.<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li>N\u00e3o foi treinado em um supercomputador, a amostra \u00e9 pequena! Quando a Databricks e a Snowflake anunciaram seus modelos e a Meta j\u00e1 estava investindo bilh\u00f5es, a DBX e a SNOW anunciaram: &#8220;N\u00e3o nos custou uma fortuna, apenas uma d\u00fazia de milh\u00f5es de d\u00f3lares&#8221;. A SAP \u00e9 muito mais barata que isso. Os autores afirmam que o modelo &#8220;base&#8221; foi treinado em uma &#8220;\u00fanica GPU H100 entre 4 e 12 dias&#8221; (ou seja, aproximadamente US$ 1.000), uma escala mais condizente com um projeto universit\u00e1rio. Pessoalmente, gasto quase US$ 1.000 por m\u00eas com o SageMaker, e infelizmente n\u00e3o fa\u00e7o muita coisa.<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li>N\u00e3o \u00e9 escal\u00e1vel. N\u00e3o apenas porque somos limitados pela Janela de Contexto, 2.073 linhas \u00d7 50 colunas, mas qualquer tentativa empresarial de pr\u00e9-treinar um modelo com tabelas reais e uma janela de contexto extremamente grande que n\u00e3o existe hoje, estar\u00e1 sujeita \u00e0s leis da escalabilidade.<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li>A contribui\u00e7\u00e3o da SAP para a pesquisa \u00e9 razoavelmente pequena \u2014 eles est\u00e3o essencialmente ajustando arquiteturas existentes em dados p\u00fablicos com recursos computacionais m\u00ednimos. Para uma empresa do porte da SAP e com seu vasto acervo de dados corporativos, isso \u00e9 surpreendentemente decepcionante.<\/li>\n<\/ul>\n\n\n\n<p>Um pouco de ESPERAN\u00c7A<\/p>\n\n\n\n<p>O que Phillipp Herzig n\u00e3o mencionou em sua postagem no blog \u00e9 que a SAP est\u00e1 explorando outro dom\u00ednio, chamado RELATE (Relational Encoder for Latent Aggregation of Typed Entities), que se concentra em redes neurais gr\u00e1ficas em bancos de dados relacionais, e n\u00e3o em dados tabulares tradicionais.<\/p>\n\n\n\n<p>Em outras palavras, trata-se de um problema completamente diferente daquele abordado pelo ConTextTab.<\/p>\n\n\n\n<p>O ConTextTab trabalha com tabelas individuais (dados tabulares tradicionais) usando classifica\u00e7\u00e3o e regress\u00e3o em linhas.<\/p>\n\n\n\n<p>O RELATE trabalha com bancos de dados relacionais com m\u00faltiplas tabelas convertidas em grafos. Grafos s\u00e3o MUITO mais valiosos para chatbots de IA do que tabelas. Isso \u00e9 mais \u00fatil e uma tecnologia comprovada.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"886\" height=\"681\" src=\"https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-11.png\" alt=\"\" class=\"wp-image-1329\" srcset=\"https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-11.png 886w, https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-11-300x231.png 300w, https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-11-768x590.png 768w\" sizes=\"auto, (max-width: 886px) 100vw, 886px\" \/><\/figure>\n<\/div>\n\n\n<p>O RELATE tamb\u00e9m n\u00e3o \u00e9 exatamente inovador em sua melhor vers\u00e3o; ele usa aten\u00e7\u00e3o cruzada no estilo Perceiver para criar embeddings de n\u00f3s para GNNs, uma tecnologia que existe h\u00e1 muitos anos, MAS \u00e9 extremamente \u00fatil se voc\u00ea controla o dom\u00ednio dos dados, o que a SAP faz, e isso faz toda a diferen\u00e7a, porque a codifica\u00e7\u00e3o agn\u00f3stica ao esquema funciona em diferentes esquemas de banco de dados. Aqui, a SAP agrega valor; nas linhas da tabela, a SAP N\u00c3O agrega valor.<\/p>\n\n\n\n<p>Pense no RELATE como um especialista em estruturas relacionais complexas com m\u00faltiplas tabelas, capaz de lidar com desafios empresariais mais realistas (j\u00e1 que bancos de dados com m\u00faltiplas tabelas s\u00e3o essenciais para os sistemas SAP).<\/p>\n\n\n\n<p>Ainda assim, gostaria de ver no RELATE se eles usam dados da SAP para construir sua GNN.<\/p>\n\n\n\n<p><strong>Minha lista de tarefas para a SAP<\/strong><\/p>\n\n\n\n<p>Espero que algu\u00e9m na SAP me leia. Aqui est\u00e3o algumas sugest\u00f5es e melhorias t\u00e9cnicas que eu espero da pesquisa em IA da SAP para a pr\u00f3xima gera\u00e7\u00e3o de modelos:<\/p>\n\n\n\n<p>1. Pr\u00e9-treinamento espec\u00edfico do dom\u00ednio<\/p>\n\n\n\n<p>Projetar tarefas de pr\u00e9-treinamento que espelhem os fluxos de trabalho reais do ERP \u2014 como prever fechamentos de per\u00edodos financeiros, detectar lan\u00e7amentos cont\u00e1beis an\u00f4malos, etc. Essas tarefas devem codificar restri\u00e7\u00f5es de l\u00f3gica de neg\u00f3cios (por exemplo, regras de contabilidade de partidas dobradas, depend\u00eancias de cadastro de materiais).<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Camadas de integra\u00e7\u00e3o de regras de neg\u00f3cios<\/li>\n<\/ol>\n\n\n\n<p>Crie arquiteturas neurais com m\u00f3dulos expl\u00edcitos para incorporar restri\u00e7\u00f5es de neg\u00f3cios r\u00edgidas \u2014 como regras de convers\u00e3o de moeda, c\u00e1lculos de impostos ou regulamenta\u00e7\u00f5es espec\u00edficas do setor \u2014 como componentes diferenci\u00e1veis.<\/p>\n\n\n\n<p>2. Arquiteturas escal\u00e1veis \u200b\u200bpara m\u00faltiplos clientes<\/p>\n\n\n\n<p>Desenvolva modelos que possam lidar com cen\u00e1rios de m\u00faltiplos clientes de forma eficiente \u2014 compartilhando representa\u00e7\u00f5es aprendidas entre clientes, mantendo o isolamento de dados estrito. Isso inclui t\u00e9cnicas como adapta\u00e7\u00f5es de aprendizado federado ou ajuste fino eficiente de par\u00e2metros por cliente.<\/p>\n\n\n\n<p>O artigo do ConTextTab admite que seu modelo (e outros semelhantes) \u201cn\u00e3o conseguem escalar seu desempenho para conjuntos de dados muito grandes\u201d. Isso \u00e9 invi\u00e1vel para uso corporativo. Devemos esperar que a SAP desenvolva arquiteturas que resolvam esse problema. Outros mecanismos de \u201caten\u00e7\u00e3o coluna-linha\u201d, como o TabICL, j\u00e1 lidam com at\u00e9 500.000 amostras.<\/p>\n\n\n\n<p>3. Modelos de processos de neg\u00f3cios<\/p>\n\n\n\n<p>Crie arquiteturas que compreendam sequ\u00eancias de processos de neg\u00f3cios.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"886\" height=\"420\" src=\"https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-12.png\" alt=\"\" class=\"wp-image-1330\" srcset=\"https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-12.png 886w, https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-12-300x142.png 300w, https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-12-768x364.png 768w\" sizes=\"auto, (max-width: 886px) 100vw, 886px\" \/><\/figure>\n<\/div>\n\n\n<p>Pedidos -&gt; Entregas -&gt; Faturas -&gt; Pagamentos<\/p>\n\n\n\n<p>Isso significa modelar depend\u00eancias temporais de longo prazo ao longo de meses\/anos, e n\u00e3o apenas caracter\u00edsticas de registro de data e hora.<\/p>\n\n\n\n<p>4. Aprendizado de Representa\u00e7\u00e3o entre M\u00f3dulos<\/p>\n\n\n\n<p>Construa modelos que aprendam representa\u00e7\u00f5es unificadas entre os m\u00f3dulos SAP (FI\/CO, MM, SD, RH). Uma compra em MM deve informar as previs\u00f5es em FI. Isso requer o tratamento simult\u00e2neo de esquemas heterog\u00eaneos e objetos de neg\u00f3cios.<\/p>\n\n\n\n<p>Os dados corporativos quase nunca s\u00e3o uma \u00fanica tabela simples. Trata-se de um banco de dados relacional complexo, com v\u00e1rias tabelas. O pr\u00f3prio artigo RELATE da SAP apresenta um codificador para &#8220;grafos relacionais multimodais&#8221;. Devemos esperar que qualquer modelo de ponta integre isso, passando da previs\u00e3o de tabela \u00fanica para o aprendizado baseado em grafos com v\u00e1rias tabelas.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"886\" height=\"780\" src=\"https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-13.png\" alt=\"\" class=\"wp-image-1331\" srcset=\"https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-13.png 886w, https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-13-300x264.png 300w, https:\/\/www.tachyonix.io\/br\/wp-content\/uploads\/2026\/01\/image-13-768x676.png 768w\" sizes=\"auto, (max-width: 886px) 100vw, 886px\" \/><\/figure>\n<\/div>\n\n\n<p>4.1 Camadas de Integra\u00e7\u00e3o de Regras de Neg\u00f3cio<\/p>\n\n\n\n<p>Crie arquiteturas neurais com m\u00f3dulos expl\u00edcitos para incorporar restri\u00e7\u00f5es de neg\u00f3cios r\u00edgidas \u2014 como regras de convers\u00e3o de moeda, c\u00e1lculos de impostos ou regulamenta\u00e7\u00f5es espec\u00edficas do setor \u2014 como componentes diferenci\u00e1veis.<\/p>\n\n\n\n<p>4.2 Intermodalidade<\/p>\n\n\n\n<p>Os modelos da SAP afirmam ser \u201cmultimodais\u201d, mas isso se limita a texto, n\u00fameros, datas e categorias. A verdadeira multimodalidade empresarial envolve muito mais. Devemos esperar ver codificadores para imagens de processos, faturas em PDF digitalizadas e talvez at\u00e9 mesmo dados de s\u00e9ries temporais de sensores de IoT, todos integrados em um \u00fanico modelo \u201crelacional\u201d.<\/p>\n\n\n\n<p>5. Infer\u00eancia de Streaming<\/p>\n\n\n\n<p>Projete modelos otimizados para infer\u00eancia em tempo real em fluxos transacionais \u2014 lidando com milh\u00f5es de itens de linha por segundo com requisitos de lat\u00eancia abaixo de um milissegundo, t\u00edpicos em sistemas de produ\u00e7\u00e3o SAP.<\/p>\n\n\n\n<p>5.1 Treinamento com Consci\u00eancia de Captura de Dados de Altera\u00e7\u00e3o (CDC)<\/p>\n\n\n\n<p>Implemente procedimentos de treinamento que funcionem com fluxos de CDC da SAP, compreendendo a diferen\u00e7a entre inser\u00e7\u00f5es, atualiza\u00e7\u00f5es e exclus\u00f5es, e aprendendo com a evolu\u00e7\u00e3o dos registros ao longo do tempo.<\/p>\n\n\n\n<p>6. Modelagem Hier\u00e1rquica de Organiza\u00e7\u00f5es<\/p>\n\n\n\n<p>Desenvolver ou lan\u00e7ar arquiteturas de grafos que representem naturalmente hierarquias organizacionais<\/p>\n\n\n\n<p>c\u00f3digos de empresas -&gt; f\u00e1bricas -&gt; locais de armazenamento<\/p>\n\n\n\n<p>e seu impacto nos padr\u00f5es de dados, incluindo o tratamento adequado da l\u00f3gica de consolida\u00e7\u00e3o.<\/p>\n\n\n\n<p>7. E muito importante. Nada de ICL, vamos fazer algo diferente.<\/p>\n\n\n\n<p>Nada contra o Aprendizado In-Context (ICL), mas n\u00e3o podemos projetar um modelo empresarial com base nesse recurso. Essa sempre ser\u00e1 sua limita\u00e7\u00e3o enquanto trabalharmos com a tecnologia existente. N\u00e3o faz sentido prosseguir at\u00e9 que os Transformers atuais evoluam ou usemos uma arquitetura diferente.<\/p>\n\n\n\n<p>H\u00e1 alguns meses, outra arquitetura gerou muita expectativa, chamada Mamba.<\/p>\n\n\n\n<p>A Mamba surgiu para resolver um problema dos Transformers: para descobrir qual deve ser a pr\u00f3xima palavra, o modelo precisa analisar e calcular uma pontua\u00e7\u00e3o para cada palavra anterior.<\/p>\n\n\n\n<p>Para um prompt de 1000 palavras, s\u00e3o realizados aproximadamente 1000 x 1000 c\u00e1lculos. Para um prompt de 100.000 palavras, isso se torna 100.000 x 100.000 \u2014 um enorme gargalo computacional. \u00c9 por isso que as janelas de contexto (a quantidade de texto que um modelo consegue &#8220;lembrar&#8221;) foram uma grande limita\u00e7\u00e3o por muito tempo; essa \u00e9 a limita\u00e7\u00e3o.<\/p>\n\n\n\n<p>O Mamba funciona mais como uma Rede Neural Recorrente (RNN). Ele processa a sequ\u00eancia um token por vez, comprimindo todas as informa\u00e7\u00f5es relevantes do passado em um &#8220;estado&#8221; compacto. O principal avan\u00e7o \u00e9 seu mecanismo seletivo: ele aprendeu quais informa\u00e7\u00f5es manter em seu estado e quais descartar, com base na entrada atual. Nessa arquitetura, o pr\u00e9-treinamento cont\u00ednuo \u00e9 uma possibilidade real.<\/p>\n\n\n\n<p>N\u00e3o estou dizendo qual arquitetura salvar\u00e1 o dia para a SAP, mas para n\u00f3s, a comunidade, n\u00e3o h\u00e1 muito que possamos fazer com o sap-rpt-1, por enquanto. Esse modelo ter\u00e1 um lugar na minha mem\u00f3ria pr\u00f3ximo aos do Snowflake ou do Databricks.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>OS FATOS Esta semana, a SAP celebra o TechEd, sua confer\u00eancia anual de tecnologia. Um dos an\u00fancios foi a estreia da divis\u00e3o de pesquisa da SAP no mundo da IA, com a publica\u00e7\u00e3o de um novo artigo na confer\u00eancia NeurIPS chamado \u201cConTextTab\u201d. O c\u00f3digo est\u00e1 dispon\u00edvel em um reposit\u00f3rio chamado sap-rpt-1-oss. O CTO da SAP, [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":1333,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-1327","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-sem-categoria"],"_links":{"self":[{"href":"https:\/\/www.tachyonix.io\/br\/wp-json\/wp\/v2\/posts\/1327","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.tachyonix.io\/br\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.tachyonix.io\/br\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.tachyonix.io\/br\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.tachyonix.io\/br\/wp-json\/wp\/v2\/comments?post=1327"}],"version-history":[{"count":2,"href":"https:\/\/www.tachyonix.io\/br\/wp-json\/wp\/v2\/posts\/1327\/revisions"}],"predecessor-version":[{"id":1335,"href":"https:\/\/www.tachyonix.io\/br\/wp-json\/wp\/v2\/posts\/1327\/revisions\/1335"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.tachyonix.io\/br\/wp-json\/wp\/v2\/media\/1333"}],"wp:attachment":[{"href":"https:\/\/www.tachyonix.io\/br\/wp-json\/wp\/v2\/media?parent=1327"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.tachyonix.io\/br\/wp-json\/wp\/v2\/categories?post=1327"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.tachyonix.io\/br\/wp-json\/wp\/v2\/tags?post=1327"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}