L'Atelier

Créations linguistiques
et mondes imaginaires
 
AccueilAccueil  PortailPortail  CalendrierCalendrier  GalerieGalerie  FAQFAQ  RechercherRechercher  MembresMembres  GroupesGroupes  S'enregistrerS'enregistrer  Connexion  

Partagez | 
 

 Statistiques et fréquence d'appartition des lettres

Voir le sujet précédent Voir le sujet suivant Aller en bas 
AuteurMessage
Atíel



Messages : 1240
Date d'inscription : 08/04/2012
Localisation : Nord

MessageSujet: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 18:54

J'ouvre ce fil car je serais curieux de connaître les particularités orthographiques des langues construites, personnelles ou non, et de voir un peu les plus exotiques sur ce point.

Je n'ai pas trouvé de sujet déjà ouvert sur ce thème (hormis celui-ci, un peu vide et plutôt orienté vers le Scrabble), mais j'ai pu retrouver ce lien posté par Genou en 2013 : Analyseur de fréquences de lettres. Le calcul est même fait pour les bigrammes et les trigrammes.

Voilà, n'hésitez pas à y copier/coller certains de vos textes pour voir les résultats.

De même, quelle serait la lettre qui débute le plus grand nombre de mots chez vous Question
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://www.europalingua.eu/ideopedia/index.php5?title=Sivélien
djingpah



Messages : 1375
Date d'inscription : 30/12/2014
Localisation : Paris

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 19:00

Après avoir analysé un texte svakâram j'ai l'honneur de vous dire que le a est de très loin la lettre la plus utilisée (22.7%) suivit du i (8.22%) puis du u (7.75%) et enfin du s (6.81%).

Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://kinichwiktoj.tumblr.com/
bedal



Messages : 3677
Date d'inscription : 23/06/2014
Localisation : Paris, France

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 19:10

l'ennui c'est qu'il ne reconnait pas les lettres additionnelles et les diacritiques !!

pour lui j'ai aucun ß ni "g"  !  

j'ai pris le 1er chapitre de mon roman, le plus long extrait disponible en algardien:

du coup c'est un peu biaisé mais :

le top 6 :

A : 16.21%
E : 13.18%
I : 10.43%
R : 9.38%
S : 7.06%
L : 6.26 %


ça ne m'étonne absolument pas ! ce sont mes lettres préférees celles que l'on retrouve probablement à chaque mot !
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://languesheimdalir.jimdo.com/
Atíel



Messages : 1240
Date d'inscription : 08/04/2012
Localisation : Nord

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 19:22

bedal a écrit:
l'ennui c'est qu'il ne reconnait pas les lettres additionnelles et les diacritiques !!

pour lui j'ai aucun ß ni "g"  !  

Oui j'ai remarqué ça après avoir ouvert ce fil !

Y'a deux solutions :
   - remplacer ces lettres par des lettres entre A et Z mais pas utilisées dans la langue (genre X/Q/...) ;
   - trouver un autre outil (j'ai rien trouvé sur le net, sur Excel en revanche ça marche bien).
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://www.europalingua.eu/ideopedia/index.php5?title=Sivélien
bedal



Messages : 3677
Date d'inscription : 23/06/2014
Localisation : Paris, France

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 19:33

ben tiens j'ai trouvé celui-ci :

http://www.dcode.fr/analyse-frequences

il prend en compte "tous caractères", j'ai donc la fréquence finale : (apres bidouillage et retour à "lettres uniquement" pour les lettres normales)

A : 16.4%
E : 13%
I  : 10.4 %
R : 9.3 %
L : 6.2 %
N : 6 %

finalement le S a été surestimé, j'imagine que l'autre logiciel a calculé  ß comme un SS !

du coup le "vrai" S se porte à 4% en 8e position, derrière le O à 4.4 %



la fréquence des caractères "spéciaux" : ß : 1.46 %, le ğ : 1.8 %  (pas mal quand même)


le ð (0.1%) et le þ (0.3%) sont très rares finalement, tout comme le P (0.2%) le Y (0.3%) et le F (0.4 %)
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://languesheimdalir.jimdo.com/
odd



Messages : 4334
Date d'inscription : 31/07/2013

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 19:35

...


Dernière édition par odd le Mer 16 Déc 2015 - 22:53, édité 1 fois
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
bedal



Messages : 3677
Date d'inscription : 23/06/2014
Localisation : Paris, France

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 19:45

j'ai pas de texte nardar ou helfina conséquent, hum...

donc je sais pas si c'est pertinent pour de petits textes...
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://languesheimdalir.jimdo.com/
odd



Messages : 4334
Date d'inscription : 31/07/2013

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 19:55

...


Dernière édition par odd le Mer 16 Déc 2015 - 22:53, édité 1 fois
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Atíel



Messages : 1240
Date d'inscription : 08/04/2012
Localisation : Nord

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 19:59

odd a écrit:
La question est: qu'en conclure ?

Personnellement, c'est juste par curiosité, et pour m'étonner.
1 lettre sur 5 est un "a" en svakâramtra, le nom de cette langue ne ment pas Smile
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://www.europalingua.eu/ideopedia/index.php5?title=Sivélien
bedal



Messages : 3677
Date d'inscription : 23/06/2014
Localisation : Paris, France

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 20:17

AEIRLNO en algardien (pour le top 7)

à comparer à :

EASINTR en français


ETAONIS en anglais


ENRISAT en allemand


EAOINSR en espagnol


du coup le "E" est utilisé en majorité dans ces langues,

l'algardien se démarque déjà avec plus de A, des I, R et L plus fréquents, et des T et S moins fréquents
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://languesheimdalir.jimdo.com/
Invité
Invité



MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 20:43

La disposition des touches des claviers AZERTY pour le français et sa légère variante pour le français de Belgique viennent de leur fréquence d'apparaition, et des contraintes techniques des typewriters. Retrouve-t-on ça dans vos Idéomondes ?

Quelqu'un a-t-il une idéolangue où la lettre la plus courante est une consonne ?

Pour le titée, le corpus n'est pas encore assez important pour que je me prononce.
Revenir en haut Aller en bas
odd



Messages : 4334
Date d'inscription : 31/07/2013

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 20:47

...


Dernière édition par odd le Mer 16 Déc 2015 - 22:54, édité 1 fois
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Invité
Invité



MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 20:49

odd a écrit:
En idiolinguistan c'eut été intéressant, chaque signe étant un sens, mais impossible de trier automatiquement... Même avec une retranscription latine... Dommage...

Et en donnant un identifiant numéral à chaque caractère ?
Revenir en haut Aller en bas
odd



Messages : 4334
Date d'inscription : 31/07/2013

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 20:58

...


Dernière édition par odd le Mer 16 Déc 2015 - 23:40, édité 1 fois
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Olivier Simon



Messages : 3851
Date d'inscription : 20/02/2009
Localisation : Lorraine

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 21:45

J'ai essayé le logiciel proposé par Bedal (sans rapport : dans le coin de ce site, une pub me demande si je voterai pour Justin Trudeau à la prochaine élection fédérale...) sur un texte sambahsa de 11 pages. Voici le résultat :

E 2272
I 1666
A 1348
S 1327
T 1248
N 1245
O 1115
R 1043
D 975
U 788
H 726
M 689
L 546
G 483
K 465
P 382
B 379
W 321
C 311
Y 303
V 196
Q 115
F 109
X 46
J 33
Z 23


#26


Total (Σ)

18154
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://sambahsa.pbwiki.com/
bedal



Messages : 3677
Date d'inscription : 23/06/2014
Localisation : Paris, France

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 22:05

ç'est étonamment similaire au Français ! mais le I passe devant le A, plus proche de l'allemand
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://languesheimdalir.jimdo.com/
Olivier Simon



Messages : 3851
Date d'inscription : 20/02/2009
Localisation : Lorraine

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Sam 10 Oct 2015 - 22:55

bedal a écrit:
ç'est étonamment similaire au Français ! mais le I passe devant le A, plus proche de l'allemand

Précisément, l'orthographe du sambahsa prend son inspiration des langues d'Europe Occidentale, notamment le français et l'allemand.
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://sambahsa.pbwiki.com/
Anoev
Modérateur


Messages : 16319
Date d'inscription : 17/10/2008
Localisation : Île-de-France

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Dim 11 Oct 2015 - 0:15

Bouh ! J'm'aperçois en choisissant un de mes textes pour faire la statistique que j'ai fait une relex assez peu logique. Il va donc falloir que je change le mot.

_________________
Tev o ĕrekes ù spraċ, la stĕ nep kànertas quas o dœm, do ep kóm o adráṅtes.
Quand tu inventes une langue, on ne sait pas forcément ce que tu penses, mais on sait comment tu raisonnes.
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
AEM



Messages : 1441
Date d'inscription : 15/01/2012

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Dim 11 Oct 2015 - 15:41

Sans surprise, le A est à la première place pour le Dèyrik.
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Anoev
Modérateur


Messages : 16319
Date d'inscription : 17/10/2008
Localisation : Île-de-France

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Lun 12 Oct 2015 - 1:48

Anoev a écrit:
Bouh ! J'm'aperçois en choisissant un de mes textes pour faire la statistique que j'ai fait une relex assez peu logique. Il va donc falloir que je change le mot.
C'est fait !

_________________
Tev o ĕrekes ù spraċ, la stĕ nep kànertas quas o dœm, do ep kóm o adráṅtes.
Quand tu inventes une langue, on ne sait pas forcément ce que tu penses, mais on sait comment tu raisonnes.
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
odd



Messages : 4334
Date d'inscription : 31/07/2013

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Lun 12 Oct 2015 - 7:47

...


Dernière édition par odd le Ven 18 Déc 2015 - 20:56, édité 1 fois
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Anoev
Modérateur


Messages : 16319
Date d'inscription : 17/10/2008
Localisation : Île-de-France

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Lun 12 Oct 2015 - 12:01

odd a écrit:
???
Pour "désabusé", j'avais dyskárvan, qui était un calque sans recherche du français "dés- + abuser". Sauf que ça ne pouvait pas correspondre à une signification exacte : l'abus (karv) ne correspond pas du tout à un espoir, même futile. Donc, je ne pouvais pas garder dys+kárv+an. Je l'ai donc remplacé par dysáton. Ato (illusion), c'est une déformation de aata (espoir) ou de aatet (espérance) : le AA est raccourci.



*L'autre traduction, pour "illusion, c'est eratvèdyn, mais c'est plutôt l'illusion dioptri... euh... d'optique.

_________________
Tev o ĕrekes ù spraċ, la stĕ nep kànertas quas o dœm, do ep kóm o adráṅtes.
Quand tu inventes une langue, on ne sait pas forcément ce que tu penses, mais on sait comment tu raisonnes.
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
bedal



Messages : 3677
Date d'inscription : 23/06/2014
Localisation : Paris, France

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Lun 12 Oct 2015 - 16:32

Anoev a écrit:
odd a écrit:
???
Pour "désabusé", j'avais dyskárvan, qui était un calque sans recherche du français "dés- + abuser". Sauf que ça ne pouvait pas correspondre à une signification exacte : l'abus (karv) ne correspond pas du tout à un espoir, même futile. Donc, je ne pouvais pas garder dys+kárv+an. Je l'ai donc remplacé par dysáton. Ato (illusion), c'est une déformation de aata (espoir) ou de aatet (espérance) : le AA est raccourci.



*L'autre traduction, pour "illusion, c'est eratvèdyn, mais c'est plutôt l'illusion dioptri... euh... d'optique.

ok, mais as-tu fait la répartition des lettres pour l'aneuvien finalement ? Smile
Revenir en haut Aller en bas
Voir le profil de l'utilisateur http://languesheimdalir.jimdo.com/
Anoev
Modérateur


Messages : 16319
Date d'inscription : 17/10/2008
Localisation : Île-de-France

MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Lun 12 Oct 2015 - 19:44

bedal a écrit:
Ok, mais as-tu fait la répartition des lettres pour l'aneuvien finalement ? Smile
Oui, et voici le résultat :

Analyseur a écrit:
Nombre de caractères analysés du texte : 301
A : 43--14.33%
E : 41--13.67%
N : 21--7%
O : 21--7%
R : 21--7%
T : 20--6.67%
D : 16--5.33%
S : 16--5.33%
L : 15--5%
U : 14--4.67%
K : 12--4%
P : 11--3.67%
M : 8--2.67%
B : 7--2.33%
V : 6--2%
C : 4--1.33%
I : 4--1.33%
X : 4--1.33%
Y : 4--1.33%
H : 3--1%
J : 3--1%
F : 2--0.67%
G : 2--0.67%
Q : 2--0.67%
W : 1--0.33%
Z : 0--0%
pour ce texte :
Ùr ove! Àt opportyn ere rec lort! Do àt lob ere rec renearanert ber klàtakun. A kjas fàl, ber loot fàktun, tep ùt ane, recedunas dysaaċan kom caldun àt kols ni sed toshese. Siă't lob dem legă ea waadă, àt remmas opan sàjev. Ùt quàtax hoψev pylaser, ùt rub-mihan nexàvkad passă; at lob dem diktă: «Æt an kàn prodòles ed rooż: eg reen nep vœnda kàplables ajoelkaden kœm pexe quav dorun med auryxe pasun!»•
Honnêtement, j'ai des doutes quant à la fiabilité des pourcentages : des lettres comme le Æ, le Œ ont-elles été prises en compte ? Avec les arrondis des poucentages, on ne peut rien vérifier du tout. Y a qu'un W, mais y a deux Œ. Par ailleurs, je me suis rendu compte qu'y avait une faute d'orthographe dans mon texte. Après correction, l'analyseur comptait deux lettres de moins (au lieu d'une).

_________________
Tev o ĕrekes ù spraċ, la stĕ nep kànertas quas o dœm, do ep kóm o adráṅtes.
Quand tu inventes une langue, on ne sait pas forcément ce que tu penses, mais on sait comment tu raisonnes.
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Contenu sponsorisé




MessageSujet: Re: Statistiques et fréquence d'appartition des lettres   Aujourd'hui à 7:05

Revenir en haut Aller en bas
 
Statistiques et fréquence d'appartition des lettres
Voir le sujet précédent Voir le sujet suivant Revenir en haut 
Page 1 sur 1
 Sujets similaires
-
» Quel logiciel de statistiques et quel test dois je utiliser
» Conseils sur les valeurs des lettres?
» Statistiques cumul de neige moyen
» Lettres de Jésus
» Du mauvais usage des statistiques par Nadine Morano

Permission de ce forum:Vous ne pouvez pas répondre aux sujets dans ce forum
L'Atelier :: Le vif du sujet :: Idéogénéral-
Sauter vers: