Pour apprendre à prononcer une langue, il faut aussi apprendre à comprendre la signification des signes utilisés pour transcrire, c’est-à-dire reproduire les phonèmes de cette langue avec des signes visuels, ce qu’on appelle couramment « la graphie » l’« écriture » (« l’écriture japonaise », ou l’écriture arabe), ou l’« orthographe » (« l’orthographe française »).
Toute transcription est un code arbitraire, une convention, qu’il faut connaitre pour pouvoir lire une langue. Même dans les nombreuses langues qui utilisent l’alphabet latin, les signes (= les lettres) n’ont pas toujours la même valeur : le signe j se lit /j/
en finnois ou en allemand, /ʒ/
en français, /ʤ/
en anglais ou en indonésien, /χ/
en espagnol…
De plus, la plupart du temps, le système de signes n’évolue pas à la même vitesse que la langue qu’il doit reproduire, et il y a un décalage parfois important entre la graphie (l’écriture) et la phonie (la prononciation). C’est le cas du français ou de l’anglais, par exemple. Dans ces langues (et dans beaucoup d’autres), on ne peut pas toujours savoir comment un mot écrit doit se prononcer, ou comment un mot qu’on entend doit s’écrire, même quand on a étudié cette langue.
Pour toutes ces raisons, on utilise par exemple dans l’enseignement des langues étrangères ou dans les dictionnaires, une transcription standardisée : l’alphabet de l’Association phonétique internationale (API), qu’on appelle couramment « transcription phonétique ». Elle permet de décrire chaque phonème de façon unique, indépendamment de la manière dont il est représenté (ou « dessiné ») dans telle ou telle langue.
Les différentes cultures ont inventé des systèmes de signes (des « écritures ») très variés pour transcrire les sons du language (les phonèmes de la langue que ces systèmes représentent). Le français, le finnois et de nombreuses autres langues utilisent les signes de l’alphabet latin. Cet alphabet comprend 26 signes. Pourtant, dans de nombreuses langues, il y a plus que 26 phonèmes. Comment les transcrire avec le nombre de signes limités de l’alphabet latin ? On a inventé différentes solutions :
/ʃ/
, ai /e/
, ou /u/
, en anglais th /ð/
ou en finnois uu /uː/
(/u/
long) ; quand on combine trois lettres pour transcrire un seul phonème, on obtient un trigramme [trigrafi, kolmoiskirjain], par exemple en français eau /o/
ou en allemand sch /ʃ/
;De nombreuses langues utilisent des digrammes. En anglais sh /ʃ/
, en suédois sj (= ɧ
), en hongrois sz (= /s/
), en italien ch (= k
), en basque tx (= /ʧ/
) sont tous des digrammes. Même en finnois, on utilise des digrammes : uu n’a pas la même valeur que u. Pour transcrire une voyelle longue, le finnois utilise donc lui aussi des digrammes (dans d’autres langues, on transcrit /u/ long par exemple ú, ū etc.).
Le hongrois est un bon exemple de langue qui utilise à la fois une grande quantité de digrammes et de signes diacritiques. Pour chaque phonème, on utilise soit une lettre simple, soit un digramme, soit un signe diacritique. Par exemple le mot zsír (« graisse ») : le groupe zs est un digramme (= /ʒ/
), í utilise un signe diacritique (i + ´ = iː
, i long), et r est une lettre simple. Le hongrois utilise une transcription pratiquement 100 % univoque [yksiselitteinen].
Le finnois utilise aussi des signes diacritiques, les trémas [treema] sur a et o : ä n’est pas la même chose que a. Le finnois utilise également dans certains mots un signe (le « háček ») sur le s : š. Le français utilise plusieurs signes diacritiques : les accents (´ aigu, ` grave, ^ circonflexe), la cédille (ç), le tréma (ï). D’autres langues en Europe utilisent des signes diacritiques : le tchèque (ý), le hongrois (ő), l’allemand (ä), le roumain (ţ), l’islandais (á) etc. L’espagnol en utilise peu (ñ, ï), l’anglais, le néerlandais, le basque n’en utilisent aucun. L’alphabet phonétique lui-même utilise de nombreux signes diacritiques ( ʴ ̬ ̥ ̡ ).
La manière de lire ou de nommer oralement les graphèmes par exemple dans des exercices de grammaire ou d’épeler un nom finlandais en français au téléphone ou à un guichet pose souvent des problèmes. Voici un bref rappel :
é « e accent aigu » [ɶaksɑ̃tegy]
(on fait la liaison en /t/ entre accent et aigu)
à « a accent grave »
è « e accent grave »
ù « u accent grave »
â « a accent circonflexe »
ê « e accent circonflexe »
î « i accent circonflexe »
ô « o accent circonflexe »
û « u accent circonflexe »
ä « a tréma »
ö « o tréma »
ï « i tréma »
ü « u tréma »
ë « e tréma »
l’ « l apostrophe »
s’ « s apostrophe »
ç « c cédille »
Remarquer qu’on n’utilise pas d’article (on ne dit pas par exemple *« a l’accent grave ») ! On peut cependant utiliser un article quand on désigne la lettre elle-même :
Le deuxième e d’évènement s’est longtemps écrit avec un accent aigu parce que l’imprimeur du dictionnaire de l’Académie en 1736 était tombé à court de lettres e avec un accent grave et qu’il avait temporairement remplacé ces lettres par des e avec un accent aigu, dont on a oublié de corriger un certain nombre dans les éditions ultérieures.
Exemples de mots épelés
Quand on épèle des lettres doubles, par exemple mm, kk, ll etc., on dit « deux m », « deux k », « deux ll » et non pas « double m/ double k / double ll » comme en finnois :
Noël : n – o – e tréma – l
maçon : m – a – c cédille – o – n
Hämäläinen : a tréma – m – a tréma – l – a tréma – i – n – e (prononcé [ɶ] et non pas [e]) – n
Lönnrot : l majuscule – o tréma – deux n – r – o – t
Ylläs : i grec majuscule – deux l – a tréma – s
Jyväskylä : j, i grec, v, a tréma, s, k, i grec, l, a tréma
Les lettres et les combinaisons de lettres ou de signes forment des unités graphiques, qu’on appelle des graphèmes. Dans le mot oiseau, il y a six lettres, qui forment trois graphèmes, oi wa
, s /z/
, eau /o/
. La lettre û (avec le signe diacritique ^ appelé « accent circonflexe »), ou bien la lettre c avec une cédille ç sont aussi des graphèmes. Certains graphèmes ne correspondent à aucun phonème, comme pt dans exempt ou prompt. D’autres ne sont pas prononcés mais ont une fonction grammaticale, comme nt dans le verbe chantent (marque de pluriel). Les graphèmes et les règles selon lesquelles on les utilise forment le système graphématique.
Du fait de l’évolution de la langue et de l’orthographe, on trouve en français
Certains graphèmes formés de plusieurs lettres peuvent aussi représenter des sons différents : dans figue, le graphème gu transcrit /g/
, mais dans figure, il transcrit gy
.
À cause de l’évolution phonétique de la langue, il y a en français une assez grande quantité de mots qui se prononcent de la même façon, mais qui ont un sens différent. On appelle ces mots des homonymes (« noms identiques »). En finnois, des homonymes comme kuusi « sapin » et kuusi « six » s’écrivent de la même manière, alors qu’en français, les homonymes sont le plus souvent écrits différemment:
sɑ̃
sans ilman, sang veri, cent sata, sent tuntee, sens tunnen, s’en se + en, c’en ce + ensɛ̃
ceint ympäröity, sain terve, sein rinta, seing allekirjoitus, saint pyhä cinq viisi (dans cinq minutes)
fwa
foi usko, foie maksa, fois kerta, Foix (nom d’une ville)
Les homonymes se prononcent de la même manière (on dit qu’ils sont homophones) mais la plupart du temps ils s’écrivent différemment : fwa
foi, fois, foie, Foix. Certains homonymes se prononcent et s’écrivent de la même manière, on dit alors que ce sont des homonymes homographes (bac lautta et bac ylioppilastutkinto). En finnois, les homonymes/ homophones sont toujours homographes. Enfin, en français, il y a aussi des homographes qui ne se prononcent pas de la même manière (ils ne sont donc pas homophones ou homonymes), ce qui est impossible en finnois :
homonymes (homophones) non homographes : poids pwa
paino, pois pwa
herne, poix pwa
piki ;
homonymes (homophones) homographes : amer amɛʁ
katkera, amer amɛʁ
merimerkki ;
homonymes (homographes) non homophones :
portions pɔʁtjõ
(me) kannoimme / portions pɔʁsjõ
annokset
couvent kuvɑ̃
luostari / couvent kuv
[he] hautovat
cassis kasi
painauma / cassis kasis
mustaherukka