Seit den sechziger Jahren wird in verschiedenen Firmen intensiv an Spracherkennungs-Systemen geforscht und entwickelt. Bis zum Beginn der achtziger Jahre reichten das Wissen und die technischen Möglichkeiten allerdings gerade aus, um Systeme zu konstruieren, die maximal einige hundert Einzelwörter erkennen konnten. Danach setzte sich die Entwicklung allerdings rasant fort.
Das Erste Sprachausgabegerät (Modell 7772) wurde 1962 von IBM vorgestellt.
1984 wurde ebenfalls von IBM ein Spracherkennungssystem vorgestellt, das mit Hilfe eines Großrechners in einem mehrere Minuten dauerndem Vorgang etwa 5000 englische Einzelworte erkennen konnte
1986 stellte IBM das System TANGORA 4 für Englisch vor, benannt nach dem Weltmeister im Maschineschreiben. Das System war echtzeitfähig auf einem normalen Arbeitsplatzrechner. Dies wurde möglich durch Spezialprozessoren. TANGORA 4 beinhaltete bereits eine Kontextprüfung mittels Trigrammstatistik und konnte dadurch Homophone unterscheiden.
Seit 1988 wurde dann in Heidelberg eine deutsche Version von TANGORA entwickelt. Sie fand Einsatz in Medizin, Gerichtswesen und Geschäftskorrespondenz. Für jedes Einsatzgebiet gab es einzelne Vokabulare, die jeweils etwa 20 -30 tausend Worte umfassten, wobei jede Wortform als eigenes Wort gezählt wird.
Auf der CeBIT 1991 wurde TANGORA 4 deutsch vorgestellt. Die Präsentation musste in einem vom Messelärm abgeschirmten Raum stattfinden, um das System vor Störgeräuschen zu schützen.
Seit Dezember 1992 war die TANGORA-Technik in einem Produkt verfügbar: der ISSS (IBM Speech Server Series). Dabei handelte es sich um eine Client/Server Lösung für einen IBM RS/6000-Server (Betriebssystem AIX), bei dem die akustische Eingabe auf einem PC mit OS/2 oder einem AIX-Rechner erfolgen musste. Einsatz fand dieses System besonders in Krankenhäusern und Kliniken.
Ende 1993 wurde ein neues, auf der TANGORA-Technologie basierendes Produkt angekündigt: Das IBM Personal Dictation System, das später in IBM VoiceType Diktiersystem umbenannt wurde. Der Preis dieses Systems war eine echte Sensation, denn bisher hatten Spracherkennungssysteme immer mehr als 10.000$ gekostet; der Preis des Personal Dictation Systems betrug hingegen weniger als 1000$. Es war als reine PC-Lösung ein Produkt für den Massenmarkt
Die Vorstellung der englischen Version erfolgte auf der CeBIT 1994, wenige Wochen später auch als deutsche Version.
Auf der CeBIT 1995 gab es eine Vorstellung des Systems (VoiceType Diktiersystem für OS/2) mit speziellem Fachvokabular für Mediziner und Anwälte. Die Präsentation war sogar in lautester Messeatmosphäre möglich.
1996 wurde dann auf der CeBIT eine neue Version vorgestellt, die keine IBM Audiokarte benötigte und auch auf Windows 95 lauffähig war: VoiceType Diktiersystem 3.0 für Windows 95
1982 wurde von ehemaligen IBM Mitarbeitern die Firma Dragon Systems gegründet. Sie brachte 1984 mit dem Dragon Dictate System das erste Spracherkennungssystem für tragbare Computer auf den Markt
1990 wurde die Philips Tochter Philips Dictation Systems gegründet. Die erste Lösung für kontinuierliche Sprache wurde 1993 vorgestellt und 1994 in einem Produkt implementiert. 1997 kam SpeechMagic auf den Markt, eine Client/Server fähige Spracherkennungslösung, 1998 FreeSpeech98, ein Konsumentenprodukt für den Massenmarkt.
Die 1987 gegründete Firma Learnout & Hauspie stellte 1997 ein erstes Spracherkennungsprodukt vor, seit 1998 sind Produkte in deutscher Sprache verfügbar.