In den Textwissenschaften stammt der Begriff Konkordanz (zurückgehend auf lat. concordare „übereinstimmen“) ursprünglich aus der Bibelwissenschaft, spielt aber auch in der Literaturwissenschaft und in benachbarten Disziplinen sowie neuerdings in besonderem Maße in der Korpuslinguistik eine wesentliche Rolle. Er bezeichnet traditionell eine alphabetisch geordnete Liste der wichtigsten Wörter und Phrasen, die in einem schriftlichen Werk verwendet werden. Zusammen mit deren Fundstellen ist meist auch ihre nächste sprachliche Umgebung, der Kontext zitiert, also etwa der gesamte Satz, in dem sie auftreten. Als Synonyme für Konkordanz gelten die Ausdrücke Register und Index oder Index verborum (‚Verzeichnis der Wörter‘). In der Korpuslinguistik werden diese in der Regel nicht verwendet, und eine Konkordanz kann hier auch Wörter und Phrasen betreffen, die aus verschriftlichten mündlichen Texten stammen. In der Korpus- und in der Computerlinguistik haben sich zudem, auch im Deutschen, der Ausdruck Key Word in Context sowie dessen Abkürzung KWIC als Benennungen für den in einer Konkordanz angezeigten Suchbegriff eingebürgert.
Konkordanzen werden heute in der Regel elektronisch erstellt und dienen in den jeweiligen Wissenschaftsdisziplinen einer ganzen Reihe von unterschiedlichen Zwecken. Damit lassen sich mehrere Beschränkungen bisheriger Konkordanzen überwinden:
Nach Überwindung derartiger Mehrfachbeschränkungen stehen sehr viele Daten für eine Textbeschreibung im Rahmen von Korpuslinguistik zur Verfügung. So ist im Fall der ursprünglichen Josefsgeschichte bereits die erste extern auch noch belegte Wortkette (Wörter 2-4, in Gen 37,2) eine Sensation, da die Dreierkette nur noch einmal in der hebräischen Bibel vorkommt, in Ex 3,1: Von Josef wie von Mose wird gesagt – übersetzt: „war ein Hirte/Hüter“. Signal am Textanfang: Beide Figuren sollen in Parallele betrachtet werden. (Das Feststellen eines solchen wortstatistischen Befundes kann synchron erfolgen. Die Argumentation bezüglich diachroner Textabhängigkeiten muss separat erfolgen.)
Vor der Zeit der modernen Datenverarbeitung war das Erstellen von Konkordanzen sehr arbeits- und zeitaufwändig und somit kostenintensiv. Daher wurden Konkordanzen nur für Werke geschaffen, für die besonderes Interesse bestand, wie beispielsweise für religiöse Texte (Bibel, Koran, Rigveda) oder für die Werke großer Schriftsteller (etwa William Shakespeare). Bereits im Mittelalter wurden Belegsammlungen für die Bibel, aber auch für kirchenrechtliche Texte unter Verwendung des lateinischen Ausdrucks concordantia erstellt. Typologisch existieren bis heute zwei Varianten:
Da die wichtigsten literarischen Werke heute in digitalisierter Form vorliegen, werden Konkordanzen nun in der Regel mittels Software erstellt, was ein komfortables Suchen nach Wörtern und Phrasen – ähnlich einer Suchmaschine im World Wide Web – ermöglicht (Volltextsuche). Es existiert bereits eine Vielzahl an unterschiedlichen Produkten, die für verschiedene Zwecke konzipiert sind – für die Bibel zum Beispiel eine ganze Reihe an Bibelprogrammen – und die auch online bedienbar sein können. Auch die Volltextsuche in vielen anderen digitalisierten Texten wie Wörterbüchern, Lexika und literarischen Sammlungen entspricht diesem Prinzip. In der Korpuslinguistik, deren Aufschwung erst durch die moderne digitale Technik ermöglicht wurde, werden Konkordanzen entweder aus speziell für ein bestimmtes Forschungsprojekt eigens entworfenen Textkorpora oder aus bereits vorgefertigten, oft ebenfalls online zugänglichen Textsammlungen gewonnen.
Frühe elektronisch erstellte Konkordanzen wurden in gedruckter Form herausgegeben, beispielsweise zu den griechischen Dichtern Hesiod[1] und Homer[2] aus dem Jahr 1977. Diese hatten bereits die Darstellungsform, wie sie heute in den Computerkonkordanzen üblich ist. Dabei umfasst eine Belegstelle eine einzelne Zeile und das jeweilige Suchwort befindet sich in der Mitte. In den heutigen elektronischen Konkordanzen kann das angezeigte Ausmaß an dem Text, der das Suchwort umgibt, aber oft verändert werden (beispielsweise beliebige Anzahl an Zeilen, ganzer Satz oder ganzer Absatz).
Solche mittels moderner Technik erstellten Konkordanzen entsprechen in mehrerlei Hinsicht nicht mehr dem herkömmlichen Modell einer gedruckten Konkordanz:
Zu sprachanalytischen Zwecken existiert eine Reihe verschiedener Softwareprodukte. Neben den sogenannten Taggern (zur Annotation von Korpora) und Parsern (zu deren syntaktischen Analyse) gibt es zur Erzeugung von Konkordanzen aus einem Korpus etliche Concordancer, die sehr unterschiedlich gestaltet und so ausgelegt sind, dass sie den jeweiligen Anforderungen der einzelnen wissenschaftlichen Forschungsgebiete entsprechen.
Das Konkordanzprogramm CoMOn etwa, das in erster Linie philologischen Bedürfnissen gerecht wird, erlaubt die Überprüfung eines vollständigen Einzeltextes mit bis zu mehreren tausend Zeichen auf sein Verhältnis zum umgebenden Korpus, wobei als Konkordanzen auch solche Treffer ausgegeben werden können, die vom vorgegebenen Suchtext bis zu einem gewissen Grad abweichen. Auch erkennt das Programm selbständig, bis zu welcher Länge Wortketten übereinstimmen. Programme wie Wordsmith Tools oder AntConc hingegen, die vorwiegend in der Linguistik Einsatz finden, bieten neben der Generierung von Konkordanzen etliche weitere Funktionen wie Kollokationsanalysen, Lemmatisierung, Keyword-Extraktion oder Ausgabe von statistischen Daten zum Korpus wie z. B. der Type-Token-Relation.
Je nach wissenschaftlicher Disziplin, Forschungsfrage, Art der verwendeten Software und Gestaltung der Konkordanz (ausgewähltes Textkorpus, Einzelbegriff oder Phrase, Umfang des in Betracht gezogenen sprachlichen Kontextes) lassen sich Konkordanzen unterschiedlich nutzen. Mit der Auflistung eines bestimmten Einzelbegriffes lässt sich beispielsweise feststellen,
Mittels der modernen Technik lassen sich auch Konkordanzen von beliebig definierten Gruppen von mehreren sprachlichen Zeichen oder Wörtern (N-Gramme) erstellen. Auf diese Weise kann eruiert werden, ob und in welchen Texten welche Wortkombinationen (Kollokationen) bevorzugt auftreten. Erkannt werden können auf diese Weise idiomatische Wendungen, formelhafter Sprachgebrauch, Zitate, Anspielungen usw., was in den betreffenden wissenschaftlichen Sparten von jeweils spezifischem Interesse ist.