Agradeço à comunidade por traduzir um artigo anterior para o português!
Estou retribuindo o favor com um novo lançamento do aplicativo de demonstração Pattern Match Workbench.
Suporte Adicionado para Português.
Agora, as legendas, botões, mensagens de feedback e textos de ajuda da interface do usuário estão atualizados para o português.
Além disso, descrições de padrões podem ser solicitadas no novo idioma.

O único Modelo de IA responsável por transformar o comando do usuário em código de correspondência de padrões foi completamente retreinado.
.png)
Modelos de Valores para Código de Padrão Também Retreinados
O modelo de IA separado para gerar código de correspondência de padrões a partir de uma lista de valores de amostra também foi retreinado.
A versão anterior do modelo mostrava uma perda de comportamentos de identificação de padrões generalizados para dar suporte a novos estilos de padrões de delimitadores.
A nova abordagem de treinamento foi desenvolvida para se adequar melhor a ambos os tipos de desafio.
A avaliação pós-treinamento das etapas do modelo foi usada para quantificar o melhor candidato para preservar a resolução de padrões generalizados.
O princípio para quantificar 100% de sucesso para cada padrão gerado foi tentar satisfazer todos os seus respectivos registros de amostra candidatos.
Relatório de Desempenho (Benchmark):
The following table gives examples from benchmark candidates demonstrating partial success.
It shows the percentage of sample records successfully matched to generated pattern code.
Legenda:
Tamanho da Amostra - O número de registros disponíveis para a amostra de teste. Às vezes, um padrão descreve menos de 31 correspondências exatas possíveis, daí os valores mais baixos.
Janela de Contexto - Número máximo de registros de amostra que se encaixam para gerar um novo padrão.
Linhas correspondidas - Este é o número de registros de amostra que foram correspondidos pelo padrão gerado.
Note que os itens 4, 6 e 8 alcançaram uma contagem de correspondências maior do que a janela de contexto.
Quando os padrões são gerados a partir de valores, a janela de contexto utilizada e a proporção de correspondência são retornadas.
Para amostras de dados desafiadoras, pode ser produtivo tentar novamente o botão "Padrão a partir de Valores" para obter resultados aprimorados.
Mostrar a janela de contexto por linha é útil para dar a oportunidade de registros específicos serem elevados para o prompt para consideração generativa.
.png)
A inferência de benchmark foi conduzida via HuggingFace Spaces para escalar a GPU disponível e garantir uma execução oportuna.
relatório é útil para analisar a proximidade qualitativa das propostas pelo LLM em termos de:
* Tipo de correspondência (String, Número, Alfanumérico, Alfabético Maiúsculo)
* Escolha do intervalo de quantidade (2 a 3 de...)
* Listas de opções ("123" ou "456")
* Elementos estruturados usando parênteses
Isso abre oportunidades para que o treinamento seja aprimorado.
Sinta-se à vontade para enviar feedback sobre melhorias para:
- Traduções de idiomas
- Comportamentos de correspondência de padrões