https://maurinsoft.com.br Thu, 14 Mar 2024 01:30:01 +0000 pt-BR hourly 1 https://wordpress.org/?v=6.4.3 Detecção de mãos e face em python https://maurinsoft.com.br/deteccao-de-maos-e-face-em-python/ Thu, 14 Mar 2024 01:29:33 +0000 https://maurinsoft.com.br/?p=25541 O uso do mediapipe auxilia quem precisa detectar mão e face no python

O site

https://developers.google.com/mediapipe

Segue o link da documentação

https://mediapipe-studio.webapps.google.com/studio/demo/interactive_segmenter

E documentação

https://github.com/googlesamples/mediapipe/blob/main/examples/interactive_segmentation/python/interactive_segmenter.ipynb

]]>
Debugando em Python https://maurinsoft.com.br/debugando-em-python/ Tue, 12 Mar 2024 14:15:01 +0000 https://maurinsoft.com.br/?p=25529 O debug de script em python é bem simples.

Entre o seguinte import, no bloco que quer debugar.

import pdb

Para inserir um ponto de parada use o comando.

pdb.set_trace()

Desta forma é possível realizar um debug por linha de comando semelhante ao gdb do c.

Para rodar o python em modo debug use o comando:,

python -m pdb [script.py]

Irei em momento oportuno mostrar maiores detalhes desta técnica.

]]>
Kaggle: Uma Plataforma para Obter Dados de Diversas Fontes https://maurinsoft.com.br/kaggle-uma-plataforma-para-obter-dados-de-diversas-fontes/ Thu, 07 Mar 2024 14:00:31 +0000 https://maurinsoft.com.br/?p=25521 Vivemos em uma era em que a quantidade de dados gerados diariamente é imensa. Empresas, organizações e até mesmo indivíduos têm acesso a uma quantidade sem precedentes de informações. No entanto, a grande questão é: como podemos aproveitar ao máximo esses dados para obter insights valiosos?

É aí que entra o Kaggle, uma plataforma online que se tornou referência quando se trata de análise de dados. O Kaggle é um verdadeiro tesouro para cientistas de dados, entusiastas e profissionais que buscam dados confiáveis e diversificados.

O que é o Kaggle?

O Kaggle é uma comunidade online que reúne cientistas de dados e entusiastas de todo o mundo. Seu principal objetivo é fornecer um espaço onde as pessoas possam compartilhar, colaborar e competir em projetos de análise de dados.

Uma das características mais interessantes do Kaggle é a sua vasta coleção de conjuntos de dados. Esses conjuntos são disponibilizados por empresas, organizações governamentais e até mesmo por outros membros da comunidade. Isso significa que você pode encontrar dados sobre praticamente qualquer assunto que possa imaginar.

Como usar o Kaggle?

Para começar a usar o Kaggle, basta visitar o site https://www.kaggle.com/ e criar uma conta gratuita. Depois de fazer isso, você terá acesso a uma variedade de recursos e ferramentas.

Uma das principais vantagens de usar o Kaggle é a capacidade de participar de competições de análise de dados. Essas competições são uma ótima maneira de testar suas habilidades e aprender com outros membros da comunidade. Além disso, elas muitas vezes oferecem prêmios em dinheiro ou oportunidades de emprego para os melhores colocados.

Outro recurso interessante do Kaggle é o Kernels. Os Kernels são notebooks interativos que permitem que você crie, execute e compartilhe código Python. Isso é especialmente útil para aqueles que estão começando na área de análise de dados e desejam aprender com exemplos práticos.

Por que usar o Kaggle?

O Kaggle é uma ferramenta poderosa para qualquer pessoa interessada em análise de dados. Aqui estão algumas razões para considerar o uso dessa plataforma:

  • Ampla variedade de conjuntos de dados: o Kaggle oferece uma enorme quantidade de dados sobre os mais diversos temas, permitindo que você encontre exatamente o que precisa para o seu projeto.
  • Comunidade ativa: o Kaggle é frequentado por uma comunidade de cientistas de dados e entusiastas que estão sempre dispostos a compartilhar conhecimento e ajudar uns aos outros.
  • Recursos educacionais: além das competições e Kernels, o Kaggle também oferece cursos e tutoriais gratuitos para quem deseja aprender mais sobre análise de dados.

Em resumo, o Kaggle é uma plataforma essencial para quem trabalha com análise de dados. Seja você um cientista de dados experiente ou apenas um entusiasta, o Kaggle oferece uma infinidade de recursos e oportunidades para aprimorar suas habilidades e encontrar os dados necessários para seus projetos.

]]>
Keras – Topologia https://maurinsoft.com.br/keras-topologia/ Wed, 06 Mar 2024 20:00:34 +0000 https://maurinsoft.com.br/?p=25508 Topologia baseada em empilhamento

Modelo sequencial

  • Densa – Totalmente conectada
  • Embedding –
  • Dropout – Remove conexões aleatórias

Função de ativação

Cada camada tem uma função de ativação.

Entre elas:

  • relu – camadas intermediarias ou ocultas, pois mostra os valores reais.
  • sigmoid – Te da um valor de probabilidade 0-1

Hiper parâmetros

Afeta a performace da rede.

  • LOSS – função de perda (mean_squared_error)
  • Optimizer – Otimizador de ajuste de pesos da rede. ADAM (stochastic gradient descent)
  • Metrics – Metrica de previsão para apurar se esta certo.

Exemplo de modelo

modelo = Sequental()

modelo.add(tipo)

modelo.add(Dropout(0.2))

modelo.add(tipo)

modelo.add(Dropout(0.2))

modelo.add(tipo)

modelo.add(Dropout(0.2))

Tipos:

#camadas intermediarias

Dense(output_dim=10, input_dim=X_train.shape[1], activation=’relu’))

#Camada de finalização

Dense(output_dim=10, input_dim=X_train.shape[1], activation=’sigmoid’))

]]>
Desenvolvimento com KINECT https://maurinsoft.com.br/desenvolvimento-com-kinect/ Mon, 04 Mar 2024 07:14:02 +0000 https://maurinsoft.com.br/?p=25489 No primeiro artigo, apresentei a instalação do kinect no ubuntu.

Artigo tratando o kinect no ubuntu

Agora iremos falar e mostrar um pouco sobre seu desenvolvimento.

GITHUB do Projeto

O projeto do libfreenect fica neste repositório.

https://github.com/OpenKinect/libfreenect.git

Site do Projeto

https://openkinect.org/wiki/Low_Level

Meu GITHUB

Ja os meus conjuntos de testes, inclusive os apresentados nos artigos relacionados, podem ser vistos, neste repositório.

https://github.com/marcelomaurin/kinect

Instalação de desenvolvimento

O processo de instalação completo foi visto no artigo anterior, porem para efeito de desenvolvimento os pacotes necessários são:

sudo apt install libudev-dev
sudo apt install libglfw3-dev
sudo apt install freeglut3-dev
sudo apt install libfreenect-dev

Sendo os 3 pacotes iniciais, apenas apoio, e o libfreenect-dev realmente a lib necessária.

Hello World da Biblioteca

Neste primeiro projeto, pouca coisa faremos, apenas iremos compilar identificando o device.

#include <stdio.h>
#include <stdlib.h>
#include <libfreenect.h>

freenect_context *f_ctx;
freenect_device *f_dev;
int user_device_number = 0; // Normalmente 0 se você tiver apenas um Kinect

void depth_cb(freenect_device *dev, void *v_depth, uint32_t timestamp) {
    // Callback para dados de profundidade - não usado neste exemplo
}

void rgb_cb(freenect_device *dev, void *rgb, uint32_t timestamp) {
    // Salva uma imagem RGB capturada pelo Kinect
    FILE *image = fopen("output_image.ppm", "wb");
    if (image == NULL) {
        printf("Erro ao abrir o arquivo para escrita\n");
        return;
    }
    fprintf(image, "P6\n# Kinect RGB test\n640 480\n255\n");
    fwrite(rgb, 640*480*3, 1, image);
    fclose(image);
    printf("Imagem salva como output_image.ppm\n");

    // Depois de salvar a imagem, podemos sair do loop principal
    freenect_stop_video(dev);
    freenect_close_device(dev);
    freenect_shutdown(f_ctx);
    exit(0);
}

int main() {
    if (freenect_init(&f_ctx, NULL) < 0) {
        printf("freenect_init() falhou\n");
        return 1;
    }

    if (freenect_open_device(f_ctx, &f_dev, user_device_number) < 0) {
        printf("Não foi possível abrir o dispositivo\n");
        freenect_shutdown(f_ctx);
        return 1;
    }

    freenect_set_depth_callback(f_dev, depth_cb);
    freenect_set_video_callback(f_dev, rgb_cb);
    freenect_set_video_mode(f_dev, freenect_find_video_mode(FREENECT_RESOLUTION_MEDIUM, FREENECT_VIDEO_RGB));

    freenect_start_video(f_dev);

    while (freenect_process_events(f_ctx) >= 0) {
        // Processa eventos do Kinect até que a captura de imagem seja concluída
    }

    return 0;
}

Neste exemplo o programa pega o kinect e tira uma foto, salvando na maquina local.

Vamos entender o código.

A freenect_init inicia a api.

A próxima função freenect_open_device, abre o device conforme o número que estiver descrito. Isso permite abrir mais de um kinect na mesma maquina.

As funções freenect_set_depth_callback e freenect_set_video_callback criam funções de callback, para controle, se voce não sabe o que é leia este artigo:

A função freenect_set_video_mode indica os parâmetros de resolução.

Por ultimo a função freenect_start_video, dá inicio ao kinect que aciona o callback quando pronto.

Makefile

Criamos aqui o arquivo de compilação do projeto.

CC=gcc
CFLAGS=-c -Wall -I/usr/include/libfreenect
LDFLAGS=-L/usr/lib/x86_64-linux-gnu -lfreenect
SOURCES=kinect.c
OBJECTS=$(SOURCES:.c=.o)
EXECUTABLE=kinect

all: $(SOURCES) $(EXECUTABLE)

$(EXECUTABLE): $(OBJECTS) 
	$(CC) $(OBJECTS) -o $@ $(LDFLAGS)

.c.o:
	$(CC) $(CFLAGS) $< -o $@

clean:
	rm -f $(OBJECTS) $(EXECUTABLE)

Perceba aqui que o pulo do gato neste makefile, é a inclusão da pasta /usr/lib/x86_64-linux-gnu que é onde a lib se encontra. Bem como a /usr/include/libfreenect que é onde o header se encontra.

Compilando o projeto

Para compilar esse projeto, é necessário apenas rodar o script na pasta src do ubuntu:

make all

Compilando o projeto

Rodando o programa

Agora iremos rodar o programa, isso é a parte mais simples.

Ao rodar, ele captura uma foto, e salva, conforme apresentado.

Foto capturada pelo kinect.

]]>
srvFalar https://maurinsoft.com.br/srvfalar-2/ Sun, 03 Mar 2024 17:51:49 +0000 https://maurinsoft.com.br/?p=25483 Foi disponibilizado mais um serviço, agora online de sintetização de voz. Nele é possível fazer a conversão de texto para voz usando o Google API.

Text2Voice server.

Neste projeto apresento duas formas de usar texto para fala, ONLINE e Offline.

GITHUB

https://github.com/marcelomaurin/srvFalar

]]>
Reconhecimento de Voz ONLINE no srvOuve https://maurinsoft.com.br/reconhecimento-de-voz-online-no-srvouve/ Sun, 03 Mar 2024 17:42:37 +0000 https://maurinsoft.com.br/?p=25481
Reconhecimento de voz usando o srvOuve, permite ouvir o que se diz.

O srvOuve, é um projeto de minha autoria, que permite criar aplicação de Voz para Texto. Neste projeto, iremos utilizar várias abordagens diferentes, para criar uma aplicação para atender essa finalidade.

Neste primeiro projeto finalizado, criamos um serviço de voz para texto que precisa ser online.

GITHUB

https://github.com/marcelomaurin/srvOuve

Vantagem

O projeto srvOuve, permite utilizar diversos serviços diferentes, ouvindo tanto online como offline, unificando assim a forma de obter esses serviços em um único canal.

Permitindo criar integrações mais ageis.

No exemplo do vídeo usamos o MNote como ferramenta de integração. Onde ele recebe o texto “escutado” pelo srvOuve e repassa ao CHATGPT, permitindo assim que esse responda, e depois convertendo em texto de voz, através do srvFalar, outro projeto de minha autoria.

]]>
Kinect 365 no UBUNTU https://maurinsoft.com.br/kinect-365-no-ubuntu/ Sun, 03 Mar 2024 17:09:01 +0000 https://maurinsoft.com.br/?p=25467 Este é um roteiro de instalação e preparação do seu UBUNTU para rodar o kinect.

O Kinect é parte integrante do XBOX 365, que apesar de já bem antigo (2024) ainda é uma tecnologia disruptiva, trazendo muitos benefícios para quem trabalha com IA e processamento de imagem.

O intuito deste tutorial é demonstrar o que é necessário para rodar o kinect no PC com linux.

Hardware

Logicamente, o kinect 365 é necessário.

Porem não somente ele, o hardware foi construído para o XBOX e possui um conector proprietário, que precisa alem de um adaptador, também de fonte externa para o PC.

Voce pode facilmente encontrar este adaptador se procurar “adaptador kinect xbox PC” em qualquer site de compras.

Software

Existe um pacote para linux que permite rodar o kinect, é o libfreenect.

Se olharmos na lista de repositórios do ubuntu por freenect, encontraremos os seguintes pacotes:

  • freenect – library for accessing Kinect device — metapackage
  • libfreenect-bin – library for accessing Kinect device — utilities and samples
  • libfreenect-demos -library for accessing Kinect device — dummy package
  • libfreenect-dev – library for accessing Kinect device — development files
  • libfreenect-doc – library for accessing Kinect device — documentation
  • libfreenect0.5 – library for accessing Kinect device

Para instalar esses pacotes siga o roteiro, instalando primeiro os pacotes requeridos.

sudo apt install build-essential cmake
sudo apt install libusb-1.0-0-dev
sudo apt install python-dev python-numpy
sudo apt install swig
sudo apt install libudev-dev
sudo apt install libglfw3-dev
sudo apt install freeglut3-dev

Agora iremos instalar os pacotes

sudo apt install freenect
sudo apt install libfreenect-bin
sudo apt install libfreenect-demos
sudo apt install libfreenect-dev
sudo apt install libfreenect-doc
sudo apt install libfreenect0.5

Testando o Kinect

Existe um conjunto de demos que foram criados para permitir usar o kinect. Vamos entender cada um.

  • freenect-camtest: Uma ferramenta de teste para verificar o funcionamento básico das câmeras RGB e de profundidade do Kinect.
  • freenect-chunkview: Utilitário para visualizar dados de “chunk” (pedaço), útil para debugar ou entender como os dados são transferidos do Kinect.
  • freenect-cpp_pcview: Um visualizador de nuvem de pontos escrito em C++, demonstrando como processar e visualizar dados de profundidade em 3D.
  • freenect-cppview: Similar ao freenect-cpp_pcview, oferece uma visualização básica da saída RGB e de profundidade usando C++.
  • freenect-glview: Provavelmente um dos exemplos mais usados, oferece uma visualização ao vivo simples das câmeras RGB e de profundidade usando OpenGL.
  • freenect-glpclview: Uma ferramenta avançada para visualizar a saída do Kinect como uma nuvem de pontos 3D, utilizando a biblioteca PCL (Point Cloud Library) e OpenGL para renderização.
  • freenect-hiview: Uma ferramenta de visualização que pode ser usada para exibir dados de alta resolução do Kinect.

Teste com freenect-glview

Demonstra o uso do kinect.

No nosso próximo artigo, irei demonstrar o uso do kinect, e fazer um exemplo de código em C.

Espero que tenham gostado.

]]>
Usando calculadora cientifica https://maurinsoft.com.br/usando-calculadora-cientifica/ Sat, 02 Mar 2024 11:17:33 +0000 https://maurinsoft.com.br/?p=25463 Vamos fazer a seguinte conta usando uma calculadora cientifica

R^2 = 200^2 + 100^2 +2 * 200 * 100 * cos 30

Para fazer isso em um unico passo.

Na calculadora cientifica faça os seguintes passos, clicando os botões da calculadora

Faça 200 [x^2] [+] 100 [x^2] [+] 2 [*] 200 [*] 100 [*] [cos] 30 [=] [raiz] [ans]

achando angulo

tag ang = co/ca

tag ang = 291,42 / 118,38

na calculadora ang = 291,42 [/] 118,38 [=] [shift] [tan] [ans]

]]>
Criando uma matriz de confusão no python https://maurinsoft.com.br/criando-uma-matriz-de-confusao-no-python/ Sat, 02 Mar 2024 10:45:03 +0000 https://maurinsoft.com.br/?p=25459 Para criar uma matriz de confusão no python, usaremos as bibliotecas do scikit-learn, para tanto, precisaremos instalar.

pip install scikit-learn

Segue abaixo o código, onde faremos a matriz de confusão.

from sklearn.metrics import confusion_matrix
import matplotlib.pyplot as plt
import seaborn as sns

# Valores reais (verdadeiros)
y_true = [2, 0, 2, 2, 0, 1]

# Valores previstos pelo modelo
y_pred = [0, 0, 2, 2, 0, 2]

# Gerar a matriz de confusão
conf_matrix = confusion_matrix(y_true, y_pred)

# Imprimir a matriz de confusão
print("Matriz de Confusão:")
print(conf_matrix)

# Para uma visualização melhor, você pode usar a biblioteca Seaborn para plotar a matriz de confusão
plt.figure(figsize=(10,7))
sns.heatmap(conf_matrix, annot=True, fmt="d")
plt.xlabel('Valores Previstos')
plt.ylabel('Valores Verdadeiros')
plt.title('Matriz de Confusão')
plt.show()

No código acima, podemos ver dois vetores, y_true, y_pred, onde os valores obtidos na leitura dos itens estão no vetor y_pred.

A matriz de referencia, é posta no y_true.

Por fim criamos a matriz de confusão:

conf_matrix = confusion_matrix(y_true, y_pred)

Criação da matriz de confusão

]]>