srvFalar
Foi disponibilizado mais um serviço, agora online de sintetização de voz. Nele é possível fazer a conversão de texto para voz usando o Google API.
Neste projeto apresento duas formas de usar texto para fala, ONLINE e Offline.
Foi disponibilizado mais um serviço, agora online de sintetização de voz. Nele é possível fazer a conversão de texto para voz usando o Google API.
Neste projeto apresento duas formas de usar texto para fala, ONLINE e Offline.
O srvOuve, é um projeto de minha autoria, que permite criar aplicação de Voz para Texto. Neste projeto, iremos utilizar várias abordagens diferentes, para criar uma aplicação para atender essa finalidade.
Neste primeiro projeto finalizado, criamos um serviço de voz para texto que precisa ser online.
https://github.com/marcelomaurin/srvOuve
O projeto srvOuve, permite utilizar diversos serviços diferentes, ouvindo tanto online como offline, unificando assim a forma de obter esses serviços em um único canal.
Permitindo criar integrações mais ageis.
No exemplo do vídeo usamos o MNote como ferramenta de integração. Onde ele recebe o texto “escutado” pelo srvOuve e repassa ao CHATGPT, permitindo assim que esse responda, e depois convertendo em texto de voz, através do srvFalar, outro projeto de minha autoria.
Fechamos a versão 2.31 e demos inicio a versão 2.32.
Na versão 2.31 foram feitos as seguintes mudanças:
Estas modificações já estão disponíveis em Windows e Linux, e em breve atualizadas na versão ARM.
Depois de algum tempo lançamos a primeira versão pré beta do srvFalar para windows.
Nessa feature desenvolvemos a aplicação amarrada ao eSpeak, porem ainda não a lib.
Foi desenvolvido a função Ler usando eSpeak integrada a LIB, e a biblioteca SAPI do windows, nativa para do próprio windows.
Para quem não conhece o srvFalar, se trata de um serviço de sintetização de voz, que permite sintetizar voz através de socket.
Estaremos disponibilizando tambem recurso para web api em breve.
Foram incorporados correções na versão Linux, permitindo a sintetização de voz, para isso foi utilizado outro projeto o srvFalar.
Com o serviço ativo, é possível sintetizar ao usar o chatgpt.
Para usar essa feature é necessário instalar o serviço srvFalar e em seguida ir em configurações e ativar o ToolsFalar.
Para instalar no linux o sintetizador, na pasta bin do git voce vai encontrar o serviço:
sudo apt install srvfalar-1.2_amd64.deb
Instalação do serviço de sintetização de voz
Agora instale o mnote no seu linux.
Vá no menu Script > config
Ao abrir a tela de config, selecione a aba ToolsFalar
Marque o Speak – Tools Falar, click em salvar.
Agora é necessário ativar o serviço de fala.
sudo systemctl start srvfalar
Ativando o serviço de sintetização
Agora podemos confirmar que o serviço esta disponível, fazendo o seguinte comando.
ps -A |grep -e srvfalar
Verificação de sintetização de voz
Agora basta perguntar ao chatgpt no seu mnote2.
Lembre-se que é necessário atribuir permissões especiais tanto para o serviço como ao chatgpt para socket e alsa devices. Em breve disponibilizarei os procedimentos para isso.
Tambem é necessário possuir token de acesso pago ao chatgpt.
Estamos trabalhando muito nessa versão 2.31.
Entre as mudanças
Ainda há um longo caminho em busca do ideal.
O MNote ainda é um projeto embrionário , e tem ainda muito a avançar.
Estamos direcionando o MNote2 para ser uma opção de Desenvolvimento Python.
Para isso muitos outros recursos e funcionalidades ainda devem ser desenvolvidas.
Acompanhe o desenvolvimento desta ferramenta.
SCREEN SHOTS
Tela principal do MNote, com código do próprio fonte.
Tela do MQuery, com acesso a banco de dados Mysql apenas no Windows garantido, o processo do linux ainda esta em desenvolvimento.
Exemplo de uso integrado com OpenAI
Fragmento de codigo , préviamente separado.
Construção e teste de WebAPI
Analise dos resultados.
Com log de comunicação
Melhoria estéticas do config, com aprimoramento e inclusão de caminhos de Libs.
O MNote2.31 esta sofrendo uma repaginada.
Algumas mudanças na versão 2.31 são:
Separação de códigos do resto da resposta
Visualização de dados
Execução de Comando e Seleção de conjunto de dados
Implementação de salvamento de atributos de conexão de banco Mysql e Postgre em MNote2.
Agora, ao tentar conectar, os atributos de conexão são automaticamente salvos para a próxima utilização.
Estas e outras modificações serão apresentadas na versão 2.31
Permite rodar SQL integrado com MQUERY, agora é possivel carregar um script em sql e rodar em mysql.
Para isso basta dar F5. O código é portado para o MQUERY permitindo ser rodado lá.
Iniciei o srvFalar no windows, o código foi portado para visual studio, no qual é possível compilar sem erros.
Foram incluídas diretivas de compilação, que serão consideradas conforme o alvo da plataforma.
marcelomaurin/srvFalar (github.com)
O proximo passo é testar as funcionalidades e avaliar no MNote2
Foi incluído pacote do srvFalar para a plataforma arm64, alem da tradicional plataforma amd64.
Com isso o projeto agora é compatível com a versão mais nova do raspberry pi, rodando em sistemas arm 64 bits.
O Servidor falar, permite converter texto em voz através de um serviço de de posta.
Respondendo através de socket tcp 8096.
Em breve disponibilizaremos também serviço de web socket.Permitindo assim a integração com aplicações web.