C/C++ srvOuve
Reconhecimento de Voz ONLINE no srvOuve
Reconhecimento de voz usando o srvOuve, permite ouvir o que se diz.

O srvOuve, é um projeto de minha autoria, que permite criar aplicação de Voz para Texto. Neste projeto, iremos utilizar várias abordagens diferentes, para criar uma aplicação para atender essa finalidade.

Neste primeiro projeto finalizado, criamos um serviço de voz para texto que precisa ser online.

GITHUB

https://github.com/marcelomaurin/srvOuve

Vantagem

O projeto srvOuve, permite utilizar diversos serviços diferentes, ouvindo tanto online como offline, unificando assim a forma de obter esses serviços em um único canal.

Permitindo criar integrações mais ageis.

No exemplo do vídeo usamos o MNote como ferramenta de integração. Onde ele recebe o texto “escutado” pelo srvOuve e repassa ao CHATGPT, permitindo assim que esse responda, e depois convertendo em texto de voz, através do srvFalar, outro projeto de minha autoria.

MNote2 srvFalar
MNote 2.32

Fechamos a versão 2.31 e demos inicio a versão 2.32.

Na versão 2.31 foram feitos as seguintes mudanças:

  • Melhora no tratamento das janelas
  • Correções no CHATGPT e uso da API
  • Correções no MQUERY para Windows
  • Criação de gráficos a partir dos datasets de select
  • Exportação para JSON e CSV dos datasets
  • Importação de CSV de dados para Mysql
  • Sintetização de vóz para windows e Linux.
  • Inicio da integração da ferramenta de criação de treinamento de redes neurais
  • srvFalar associado ao projeto MNote

Estas modificações já estão disponíveis em Windows e Linux, e em breve atualizadas na versão ARM.

Sintetização de Voz

Apresentação de melhorias na versão 2.31 usando o chatgpt.

Criação de Gráficos

Criação de gráficos no MNote2

ESPEAK MNote2 srvFalar
srvFalar para windows

Depois de algum tempo lançamos a primeira versão pré beta do srvFalar para windows.

Nessa feature desenvolvemos a aplicação amarrada ao eSpeak, porem ainda não a lib.

Foi desenvolvido a função Ler usando eSpeak integrada a LIB, e a biblioteca SAPI do windows, nativa para do próprio windows.

Para quem não conhece o srvFalar, se trata de um serviço de sintetização de voz, que permite sintetizar voz através de socket.

Estaremos disponibilizando tambem recurso para web api em breve.

GitHub – marcelomaurin/srvFalar

MNote2
MNote2 – Correções

Foram incorporados correções na versão Linux, permitindo a sintetização de voz, para isso foi utilizado outro projeto o srvFalar.

Com o serviço ativo, é possível sintetizar ao usar o chatgpt.

Para usar essa feature é necessário instalar o serviço srvFalar e em seguida ir em configurações e ativar o ToolsFalar.

Para instalar no linux o sintetizador, na pasta bin do git voce vai encontrar o serviço:

sudo apt install srvfalar-1.2_amd64.deb

Instalação do serviço de sintetização de voz

Agora instale o mnote no seu linux.

Vá no menu Script > config

Ao abrir a tela de config, selecione a aba ToolsFalar

Marque o Speak – Tools Falar, click em salvar.

Agora é necessário ativar o serviço de fala.

sudo systemctl start srvfalar

Ativando o serviço de sintetização

Agora podemos confirmar que o serviço esta disponível, fazendo o seguinte comando.

ps -A |grep -e srvfalar

Verificação de sintetização de voz

Agora basta perguntar ao chatgpt no seu mnote2.

Lembre-se que é necessário atribuir permissões especiais tanto para o serviço como ao chatgpt para socket e alsa devices. Em breve disponibilizarei os procedimentos para isso.

Tambem é necessário possuir token de acesso pago ao chatgpt.

MNote2 Python
MNote2 – 2.31

Estamos trabalhando muito nessa versão 2.31.

Entre as mudanças

  • Fizemos a incorporação e melhoria do MQuery, onde reestilizamos vários itens.
  • Finalizamos os ajustes no windows das pesquisas no Mysql usando o MQuery.
  • Inclusão da função de embelazamento assistido, com a IA .
  • Melhorias significantes do uso da IA, com captura de codigo.
  • Incorporação de fonte em andamento do IMGJSON, responsável pela fabricação de Json de treinamento para redes neurais.
  • Incorporação de caminho das Libs no config para desenvolvimento em Linux/Windows/ARM
  • Divisão do CONFIG em abas, para maior entendimento do projeto.

Ainda há um longo caminho em busca do ideal.

O MNote ainda é um projeto embrionário , e tem ainda muito a avançar.

Estamos direcionando o MNote2 para ser uma opção de Desenvolvimento Python.

Para isso muitos outros recursos e funcionalidades ainda devem ser desenvolvidas.

Acompanhe o desenvolvimento desta ferramenta.

SCREEN SHOTS

Tela principal do MNote, com código do próprio fonte.

Tela do MQuery, com acesso a banco de dados Mysql apenas no Windows garantido, o processo do linux ainda esta em desenvolvimento.

Exemplo de uso integrado com OpenAI

Fragmento de codigo , préviamente separado.

Construção e teste de WebAPI

Analise dos resultados.

Com log de comunicação

Melhoria estéticas do config, com aprimoramento e inclusão de caminhos de Libs.

MNote2
MNote2.31

O MNote2.31 esta sofrendo uma repaginada.

Algumas mudanças na versão 2.31 são:

  • Interface mais amigável com chatgpt
  • Integração com banco de dados Mysql
  • Melhoria na execução de código em python

ChatGPT

Separação de códigos do resto da resposta

Banco de dados

Visualização de dados

Execução de Comando e Seleção de conjunto de dados

MNote2
MNote2 – Melhoria 10/01 MNote2

Implementação de salvamento de atributos de conexão de banco Mysql e Postgre em MNote2.

Agora, ao tentar conectar, os atributos de conexão são automaticamente salvos para a próxima utilização.

Estas e outras modificações serão apresentadas na versão 2.31

Integração com MQUERY

Permite rodar SQL integrado com MQUERY, agora é possivel carregar um script em sql e rodar em mysql.

Para isso basta dar F5. O código é portado para o MQUERY permitindo ser rodado lá.

ESPEAK srvFalar
srfFalar – Nova plataforma

Foi incluído pacote do srvFalar para a plataforma arm64, alem da tradicional plataforma amd64.

Com isso o projeto agora é compatível com a versão mais nova do raspberry pi, rodando em sistemas arm 64 bits.

O Servidor falar, permite converter texto em voz através de um serviço de de posta.

Respondendo através de socket tcp 8096.

Em breve disponibilizaremos também serviço de web socket.Permitindo assim a integração com aplicações web.

maurinsoft.com.br