Assistente de voz usando python
Como sabemos, Python é uma linguagem adequada para escritores e desenvolvedores de scripts. Vamos escrever um script para o Voice Assistant usando Python. A consulta do assistente pode ser manipulada conforme a necessidade do usuário.
O reconhecimento de voz é o processo de conversão de áudio em texto. Isso é comumente usado em assistentes de voz como Alexa, Siri, etc. Python fornece uma API chamada SpeechRecognition para nos permitir converter áudio em texto para processamento posterior. Neste artigo, veremos como converter arquivos de áudio grandes ou longos em texto usando a API SpeechRecognition em python.
Módulos necessários
- Subprocesso: - Este módulo é usado para obter detalhes do subprocesso do sistema que são usados em vários comandos, por exemplo, Desligar, Suspender, etc. Este módulo vem integrado com Python.
- Wolframalpha: - É usado para computar respostas de nível especializado usando algoritmos, base de conhecimento e tecnologia de IA do Wolfram. Para instalar este módulo, digite o comando abaixo no terminal.
pip install wolframaplha
- Pyttsx3: - Este módulo é usado para conversão de texto em fala em um programa que funciona offline. Para instalar este módulo, digite o comando abaixo no terminal.
pip install pyttsx3
- Tkinter: - Este módulo é usado para construir GUI e vem integrado com Python. Este módulo vem integrado com Python.
- Wikipedia: - Como todos sabemos, a Wikipedia é uma grande fonte de conhecimento, assim como GeeksforGeeks, usamos o módulo da Wikipedia para obter informações da Wikipedia ou para realizar pesquisas na Wikipedia. Para instalar este módulo, digite o comando abaixo no terminal.
pip install wikipedia
- Reconhecimento de voz: - Como estamos construindo um aplicativo de assistente de voz, uma das coisas mais importantes nisso é que seu assistente reconhece sua voz (significa o que você quer dizer / perguntar). Para instalar este módulo, digite o comando abaixo no terminal.
pip install SpeechRecognition
- Navegador da web: - Para realizar a pesquisa na web. Este módulo vem integrado com Python.
- Ecapture: - Para capturar imagens de sua câmera. Para instalar este módulo, digite o comando abaixo no terminal.
pip install ecapture
- Pyjokes: - Pyjokes é usado para coletar Python Jokes na Internet. Para instalar este módulo, digite o comando abaixo no terminal.
pip instalar pyjokes
- Data e hora: - Data e hora é usada para mostrar a data e a hora. Este módulo vem integrado com Python.
- Twilio: - Twilio é usado para fazer chamadas e mensagens. Para instalar este módulo, digite o comando abaixo no terminal.
pip instalar twilio
- Requests: Requests é usado para fazer solicitações GET e POST. Para instalar este módulo, digite o comando abaixo no terminal.
pedidos de instalação pip
- BeautifulSoup: Beautiful Soup é uma biblioteca que facilita a extração de informações de páginas da web. Para instalar este módulo, digite o comando abaixo no terminal.
pip instalar beautifulsoup4
Nota: Você pode remover parte do arquivo de importação se não quiser obter esse recurso, como aqui twilio para fazer chamadas e mensagens, se não quiser usá-lo, basta remover essa função.
Implementação
Importe as bibliotecas abaixo.
import
subprocess
import
wolframalpha
import
pyttsx3
import
tkinter
import
json
import
random
import
operator
import
speech_recognition as sr
import
datetime
import
wikipedia
import
webbrowser
import
os
import
winshell
import
pyjokes
import
feedparser
import
smtplib
import
ctypes
import
time
import
requests
import
shutil
from
twilio.rest
import
Client
from
clint.textui
import
progress
from
ecapture
import
ecapture as ec
from
bs4
import
BeautifulSoup
import
win32com.client as wincl
from
urllib.request
import
urlopen
Agora vamos definir nosso mecanismo para Pyttsx3, que é usado para texto em fala em Python e sapi5 é a interface da plataforma de aplicativo de fala da Microsoft que usaremos para a função de texto em fala.
engine
=
pyttsx3.init(
'sapi5'
)
voices
=
engine.getProperty(
'voices'
)
engine.setProperty(
'voice'
, voices[
1
].
id
)
Você pode alterar a identificação de voz para “0” para voz masculina enquanto usa o assistente, aqui estamos usando a voz feminina para todas as mensagens de texto para fala
def
speak(audio):
engine.say(audio)
engine.runAndWait()
def
wishMe():
hour
=
int
(datetime.datetime.now().hour)
if
hour>
=
0
and
hour<
12
:
speak(
"Good Morning Sir !"
)
elif
hour>
=
12
and
hour<
18
:
speak(
"Good Afternoon Sir !"
)
else
:
speak(
"Good Evening Sir !"
)
assname
=
(
"Jarvis 1 point o"
)
speak(
"I am your Assistant"
)
speak(assname)
def
usrname():
speak(
"What should i call you sir"
)
uname
=
takeCommand()
speak(
"Welcome Mister"
)
speak(uname)
columns
=
shutil.get_terminal_size().columns
(
"#####################"
.center(columns))
(
"Welcome Mr."
, uname.center(columns))
(
"#####################"
.center(columns))
speak(
"How can i Help you, Sir"
)
def
takeCommand():
r
=
sr.Recognizer()
with sr.Microphone() as source:
(
"Listening..."
)
r.pause_threshold
=
1
audio
=
r.listen(source)
try
:
(
"Recognizing..."
)
query
=
r.recognize_google(audio, language
=
'en-in'
)
(f
"User said: {query}\n"
)
except
Exception as e:
(e)
(
"Unable to Recognize your voice."
)
return
"None"
return
query
def
sendEmail(to, content):
server
=
smtplib.SMTP(
'smtp.gmail.com'
,
587
)
server.ehlo()
server.starttls()
server.login(
'your email id'
,
'your email passowrd'
)
server.sendmail(
'your email id'
, to, content)
server.close()
A função principal começa aqui, agora chamaremos todas essas funções na função principal.
if
__name__
=
=
'__main__'
:
clear
=
lambda
: os.system(
'cls'
)
clear()
wishMe()
usrname()
while
True
:
query
=
takeCommand().lower()
if
'wikipedia'
in
query:
speak(
'Searching Wikipedia...'
)
query
=
query.replace(
"wikipedia"
, "")
results
=
wikipedia.summary(query, sentences
=
3
)
speak(
"According to Wikipedia"
)
(results)
speak(results)
elif
'open youtube'
in
query:
speak(
"Here you go to Youtube\n"
)
webbrowser.
open
(
"youtube.com"
)
elif
'open google'
in
query:
speak(
"Here you go to Google\n"
)
webbrowser.
open
(
"google.com"
)
elif
'open stackoverflow'
in
query:
speak(
"Here you go to Stack Over flow.Happy coding"
)
webbrowser.
open
(
"stackoverflow.com"
)
elif
'play music'
in
query
or
"play song"
in
query:
speak(
"Here you go with music"
)
music_dir
=
"C:\\Users\\GAURAV\\Music"
songs
=
os.listdir(music_dir)
(songs)
random
=
os.startfile(os.path.join(music_dir, songs[
1
]))
elif
'the time'
in
query:
strTime
=
datetime.datetime.now().strftime(
"% H:% M:% S"
)
speak(f
"Sir, the time is {strTime}"
)
elif
'open opera'
in
query:
codePath
=
r
"C:\\Users\\GAURAV\\AppData\\Local\\Programs\\Opera\\launcher.exe"
os.startfile(codePath)
elif
'email to gaurav'
in
query:
try
:
speak(
"What should I say?"
)
content
=
takeCommand()
to
=
"Receiver email address"
sendEmail(to, content)
speak(
"Email has been sent !"
)
except
Exception as e:
(e)
speak(
"I am not able to send this email"
)
elif
'send a mail'
in
query:
try
:
speak(
"What should I say?"
)
content
=
takeCommand()
speak(
"whome should i send"
)
to
=
input
()
sendEmail(to, content)
speak(
"Email has been sent !"
)
except
Exception as e:
(e)
speak(
"I am not able to send this email"
)
elif
'how are you'
in
query:
speak(
"I am fine, Thank you"
)
speak(
"How are you, Sir"
)
elif
'fine'
in
query
or
"good"
in
query:
speak(
"It's good to know that your fine"
)
elif
"change my name to"
in
query:
query
=
query.replace(
"change my name to"
, "")
assname
=
query
elif
"change name"
in
query:
speak(
"What would you like to call me, Sir "
)
assname
=
takeCommand()
speak(
"Thanks for naming me"
)
elif
"what's your name"
in
query
or
"What is your name"
in
query:
speak(
"My friends call me"
)
speak(assname)
(
"My friends call me"
, assname)
elif
'exit'
in
query:
speak(
"Thanks for giving me your time"
)
exit()
elif
"who made you"
in
query
or
"who created you"
in
query:
speak(
"I have been created by Gaurav."
)
elif
'joke'
in
query:
speak(pyjokes.get_joke())
elif
"calculate"
in
query:
app_id
=
"Wolframalpha api id"
client
=
wolframalpha.Client(app_id)
indx
=
query.lower().split().index(
'calculate'
)
query
=
query.split()[indx
+
1
:]
res
=
client.query(
' '
.join(query))
answer
=
next
(res.results).text
(
"The answer is "
+
answer)
speak(
"The answer is "
+
answer)
elif
'search'
in
query
or
'play'
in
query:
query
=
query.replace(
"search"
, "")
query
=
query.replace(
"play"
, "")
webbrowser.
open
(query)
elif
"who i am"
in
query:
speak(
"If you talk then definately your human."
)
elif
"why you came to world"
in
query:
speak(
"Thanks to Gaurav. further It's a secret"
)
elif
'power point presentation'
in
query:
speak(
"opening Power Point presentation"
)
power
=
r
"C:\\Users\\GAURAV\\Desktop\\Minor Project\\Presentation\\Voice Assistant.pptx"
os.startfile(power)
elif
'is love'
in
query:
speak(
"It is 7th sense that destroy all other senses"
)
elif
"who are you"
in
query:
speak(
"I am your virtual assistant created by Gaurav"
)
elif
'reason for you'
in
query:
speak(
"I was created as a Minor project by Mister Gaurav "
)
elif
'change background'
in
query:
ctypes.windll.user32.SystemParametersInfoW(
20
,
0
,
"Location of wallpaper"
,
0
)
speak(
"Background changed succesfully"
)
elif
'open bluestack'
in
query:
appli
=
r
"C:\\ProgramData\\BlueStacks\\Client\\Bluestacks.exe"
os.startfile(appli)
elif
'news'
in
query:
try
:
jsonObj
=
urlopen(
)
data
=
json.load(jsonObj)
i
=
1
speak(
'here are some top news from the times of india'
)
(
+
'\n')
for
item
in
data[
'articles'
]:
(
str
(i)
+
'. '
+
item[
'title'
]
+
'\n'
)
(item[
'description'
]
+
'\n'
)
speak(
str
(i)
+
'. '
+
item[
'title'
]
+
'\n'
)
i
+
=
1
except
Exception as e:
(
str
(e))
elif
'lock window'
in
query:
speak(
"locking the device"
)
ctypes.windll.user32.LockWorkStation()
elif
'shutdown system'
in
query:
speak(
"Hold On a Sec ! Your system is on its way to shut down"
)
subprocess.call(
'shutdown / p /f'
)
elif
'empty recycle bin'
in
query:
winshell.recycle_bin().empty(confirm
=
False
, show_progress
=
False
, sound
=
True
)
speak(
"Recycle Bin Recycled"
)
elif
"don't listen"
in
query
or
"stop listening"
in
query:
speak(
"for how much time you want to stop jarvis from listening commands"
)
a
=
int
(takeCommand())
time.sleep(a)
(a)
elif
"where is"
in
query:
query
=
query.replace(
"where is"
, "")
location
=
query
speak(
"User asked to Locate"
)
speak(location)
webbrowser.
open
(
"https://www.google.nl / maps / place/"
+
location
+
"")
elif
"camera"
in
query
or
"take a photo"
in
query:
ec.capture(
0
,
"Jarvis Camera "
,
"img.jpg"
)
elif
"restart"
in
query:
subprocess.call([
"shutdown"
,
"/r"
])
elif
"hibernate"
in
query
or
"sleep"
in
query:
speak(
"Hibernating"
)
subprocess.call(
"shutdown / h"
)
elif
"log off"
in
query
or
"sign out"
in
query:
speak(
"Make sure all the application are closed before sign-out"
)
time.sleep(
5
)
subprocess.call([
"shutdown"
,
"/l"
])
elif
"write a note"
in
query:
speak(
"What should i write, sir"
)
note
=
takeCommand()
file
=
open
(
'jarvis.txt'
,
'w'
)
speak(
"Sir, Should i include date and time"
)
snfm
=
takeCommand()
if
'yes'
in
snfm
or
'sure'
in
snfm:
strTime
=
datetime.datetime.now().strftime(
"% H:% M:% S"
)
file
.write(strTime)
file
.write(
" :- "
)
file
.write(note)
else
:
file
.write(note)
elif
"show note"
in
query:
speak(
"Showing Notes"
)
file
=
open
(
"jarvis.txt"
,
"r"
)
(
file
.read())
speak(
file
.read(
6
))
elif
"update assistant"
in
query:
speak(
"After downloading file please replace this file with the downloaded one"
)
url
=
'# url after uploading file'
r
=
requests.get(url, stream
=
True
)
with
open
(
"Voice.py"
,
"wb"
) as Pypdf:
total_length
=
int
(r.headers.get(
'content-length'
))
for
ch
in
progress.bar(r.iter_content(chunk_size
=
2391975
),
expected_size
=
(total_length
/
1024
)
+
1
):
if
ch:
Pypdf.write(ch)
elif
"jarvis"
in
query:
wishMe()
speak(
"Jarvis 1 point o in your service Mister"
)
speak(assname)
elif
"weather"
in
query:
api_key
=
"Api key"
base_url
=
"http://api.openweathermap.org / data / 2.5 / weather?"
speak(
" City name "
)
(
"City name : "
)
city_name
=
takeCommand()
complete_url
=
base_url
+
"appid ="
+
api_key
+
"&q ="
+
city_name
response
=
requests.get(complete_url)
x
=
response.json()
if
x[
"cod"
] !
=
"404"
:
y
=
x[
"main"
]
current_temperature
=
y[
"temp"
]
current_pressure
=
y[
"pressure"
]
current_humidiy
=
y[
"humidity"
]
z
=
x[
"weather"
]
weather_description
=
z[
0
][
"description"
]
(
" Temperature (in kelvin unit) = "
+
str
(current_temperature)
+
"\n atmospheric pressure (in hPa unit) ="
+
str
(current_pressure)
+
"\n humidity (in percentage) = "
+
str
(current_humidiy)
+
"\n description = "
+
str
(weather_description))
else
:
speak(
" City Not Found "
)
elif
"send message "
in
query:
account_sid
=
'Account Sid key'
auth_token
=
'Auth token'
client
=
Client(account_sid, auth_token)
message
=
client.messages \
.create(
body
=
takeCommand(),
from_
=
'Sender No'
,
to
=
'Receiver No'
)
(message.sid)
elif
"wikipedia"
in
query:
webbrowser.
open
(
"wikipedia.com"
)
elif
"Good Morning"
in
query:
speak(
"A warm"
+
query)
speak(
"How are you Mister"
)
speak(assname)
elif
"will you be my gf"
in
query
or
"will you be my bf"
in
query:
speak(
"I'm not sure about, may be you should give me some time"
)
elif
"how are you"
in
query:
speak(
"I'm fine, glad you me that"
)
elif
"i love you"
in
query:
speak(
"It's hard to understand"
)
elif
"what is"
in
query
or
"who is"
in
query:
client
=
wolframalpha.Client(
"API_ID"
)
res
=
client.query(query)
try
:
(
next
(res.results).text)
speak (
next
(res.results).text)
except
StopIteration:
(
"No results"
)
Resultado:
Ouvindo…
Reconhecendo… O
usuário disse: Gaurav
########################
Bem-vindo Sr. Gaurav
#################### ####
Ouvindo ...
Reconhecendo ... O
usuário disse: sim
('Como os maiores de história entre vocês aqui hoje sabem muito bem, quando as pessoas no poder inventam seus próprios fatos e atacam aqueles que os questionam, isso pode marcar o começo do fim de uma sociedade livre. Isso não é uma hipérbole. É o que os regimes autoritários fizeram ao longo da história. Eles tentam controlar a realidade. Não apenas nossas leis e nossos direitos e nossos orçamentos, mas nossos pensamentos e crenças. ',' Hillary Clinton ')
Ouvindo ...
Reconhecendo ... O
usuário disse: Gaurav na Wikipedia
Gaurav é um nome masculino indiano e nepalês. O nome significa literalmente orgulho.
== Pessoas notáveis chamadas Gaurav ==
Gaurav S Bajaj, ator de televisão indiano
Gaurav Bhatt, diretor musical indiano, cantor e compositor.
Ouvindo…
Reconhecendo… O
usuário disse: abra o YouTube
Ouvindo…
Reconhecendo…
Incapaz de reconhecer sua voz.
Ouvindo ...
Reconhecendo ... O
usuário disse: saia
As postagens do blog Acervo Lima te ajudaram? Nos ajude a manter o blog no ar!
Faça uma doação para manter o blog funcionando.
70% das doações são no valor de R$ 5,00...
Diógenes Lima da Silva