![WhatsApp Sprachnachrichten in Text mit OpenAI Whisper Speech-To-Text WhatsApp Sprachnachrichten in Text mit OpenAI Whisper Speech-To-Text](https://www.spech.de/2023/04/whatsapp-sprachnachrichten-in-text-mit-openai-whisper-speech-to-text/ai-generated-7772547_1280_hu14043872226190686229.jpg)
WhatsApp Sprachnachrichten in Text mit OpenAI Whisper Speech-To-Text
07.04.2023
Whisper von OpenAI hat eine beeindruckende Qualität um Sprache in Text umzuwandeln. Wenn dir Sprachnachrichten in WhatsApp zu umständlich sind, kannst du diese mit diesem kleinen Python Skript in Text umwandeln. Einfach die Sprachnachricht in WhatsApp Web speichern und das Skript mit dem Dateinamen als Parameter aufrufen.
Das Skript konvertiert automatisch die Datei in das mp3 Format, wenn diese in ogg vorliegt. Dazu muss ffmpeg installiert sein.
Installation
sudo apt-get install ffmpeg
pip install openai
Python Skript
Die folgende Datei als whisper.py
speichern und mit python3 whisper.py <Dateiname>
ausführen.
![Ausgabe von ChatGPT Text im JSON und CSV Format Ausgabe von ChatGPT Text im JSON und CSV Format](https://www.spech.de/2023/04/ausgabe-von-chatgpt-text-im-json-und-csv-format/artificial-intelligence-7834467_1280_hu9013613661458063002.jpg)
Ausgabe von ChatGPT Text im JSON und CSV Format
06.04.2023
Mit der Angabe eines Formats können die Ausgaben von ChatGPT-4 im JSON oder CSV Format ausgegeben werden. Test auf OpenAI Playground .
JSON
USER
Classify the following items as fruit or vegetable: apple, banana, cucumber.
Output the data as JSON in the format [{"name": "Apple", "type": "Fruit/Vegetable"}]
ASSISTANT
[{"name": "Apple", "type": "Fruit"}, {"name": "Banana", "type": "Fruit"}, {"name": "Cucumber", "type": "Vegetable"}]
CSV
USER
Classify the following items as fruit or vegetable: apple, banana, cucumber. Output the data as CSV in the format "name", "type"
ASSISTANT
"apple", "fruit"
"banana", "fruit"
"cucumber", "vegetable"
Gist: GitHub .
Weiterlesen… ( ~1 Min.)![Hetzner Server mit Ansible automatisch bereitstellen Hetzner Server mit Ansible automatisch bereitstellen](https://www.spech.de/2020/11/hetzner-server-mit-ansible-automatisch-bereitstellen/source-4280758_1280_hu4723756596412757580.jpg)
Hetzner Server mit Ansible automatisch bereitstellen
21.11.2020
Ansible ermöglicht nicht nur die schnelle Installation und Konfiguration von Software auf Servern und anderen Systemen, es ermöglicht auch die Erstellung ganzer virtueller Serverumgebungen. Hetzner hat seinen Hauptsitz in Deutschland und bietet hier ebenfalls mehrere Serverstandorte an. Die kleinsten Cloudserver kosten dabei monatlich nicht mehr als eine Tasse Kaffee. Dies ist die perfekte Kombination um für wenig Geld mit Clouddiensten, Servervirtualisierung und DevOps Abläufen Erfahrung zu sammeln oder komplette Virtual Data Center Umgebungen automatischen zu erstellen.
Weiterlesen… ( ~5 Min.)![Kabellose Terrarium Steuerung bauen mit Raspberry Pi Kabellose Terrarium Steuerung bauen mit Raspberry Pi](https://www.spech.de/2020/07/kabellose-terrarium-steuerung-bauen-mit-raspberry-pi/zigbee_home_assistant_hu11954410156967868704.jpg)
Kabellose Terrarium Steuerung bauen mit Raspberry Pi
11.07.2020
In einer älteren Serie beschrieb ich die Steuerung eines Terrariums mit Hilfe von Funksteckdosen und kabelgebundenen Sensoren. In diesem Artikel geht es um eine kabellose Variante der Steuerung. Anstelle von pimatic bildet Home Assistant die zentrale Einheit für die Haussteuerung (bzw. Terrarium 😉). Alle Sensoren und Aktoren setzen auf die drahtlose Netzwerktechnologie ZigBee. Die Einrichtung ist dadurch viel einfacher und neue Komponenten können in wenigen Minuten in das Netzwerk aufgenommen werden. Durch die Mesh-Netzwerk Technologie lassen sich weitere Entfernungen zwischen Geräten überbrücken.
Weiterlesen… ( ~6 Min.)![Sprachausgabe im Browser (TTS) Sprachausgabe im Browser (TTS)](https://www.spech.de/2020/07/sprachausgabe-im-browser-tts/learn-2001847_1280_hu14200222568490763746.jpg)
Sprachausgabe im Browser (TTS)
10.07.2020
Mit dem experimentiellen Modul SpeechSynthesis der Web Speech API lässt sich eine Sprachausgabe in modernen Browsern erzeugen. Bis auf den Internet Explorer unterstützen dabei alle Browser diese Funktion. Google Chrome bietet jedoch die besten künstlichen Stimmen. Diese Technik nutze ich auf meiner Webseite FitTeller zum Vorlesen eines Trainingsplans.
Sprachen ermitteln
Auf dem window
Objekt lässt sich das speechSynthesis
Modul nutzen. Die Methode getVoices()
gibt eine Liste aller unterstützen Sprachausgaben bzw. Stimmen aus.
Mit dem folgenden Code können in Debugger des Browsers (Strg + Shift + i
oder Weitere Tools -> Entwicklertools) beispielsweise alle Stimmen analysiert werden.
![Datenhoheit mit Nextcloud zurückgewinnen Datenhoheit mit Nextcloud zurückgewinnen](https://www.spech.de/2019/09/datenhoheit-mit-nextcloud-zur%C3%BCckgewinnen/cloud-computing-2001090_1280_hu5302774037047821815.jpg)
Datenhoheit mit Nextcloud zurückgewinnen
15.09.2019
Google, Microsoft, Amazon, Apple und viele mehr wollen mit Produkten wie OneDrive, Dropbox, Google Drive und iCloud Einsicht in unsere persönlichen Daten und Fotos. Der große Vorteil der Dienste ist, dass diese sich sehr leicht installieren und einrichten lassen. Viele Programme sind auf modernen PCs und Mobilgeräten bereits vorinstalliert. Mit Nextcloud gibt es aber eine einfache Variante die Datenhoheit wieder zurück zu bekommen. Für alle Endgeräte stehen passende Apps und Programme zur Verfügung. Ich habe den Schritt vor ein paar Monaten gemacht und teile hier meine Erfahrungen.
Weiterlesen… ( ~4 Min.)