AraMorph

the AraMorph site
 
   

Format de fichier des dictionnaires

Préfixes

Examinons ce fragment du dictionnaire de préfixes gpl/pierrick/brihaye/aramorph/dictionaries/dictPrefixes :

	  ; conjunctions
	  w	wa	Pref-Wa	and <pos>wa/CONJ+</pos>
	  f	fa	Pref-Wa	and;so <pos>fa/CONJ+</pos>
	  

On constate que les commentaires sont introduits par ; et que les lignes significatives sont divisées au moyen de tabulations déterminant respectivement :

  1. le squelette consonnantique du préfixe (selon le système de translitération de Buckwalter)
  2. la vocalisation du préfixe (selon le même système)
  3. la catégorie morphologique du préfixe
  4. une ou plusieurs traductions du préfixe suivies d'une ou plusieurs catégories grammaticales. Noter le + indiquant qu'un radical est attendu après ce préfixe.

Certaines informations sont facultatives. L'exemple le plus caractéristique est celui du préfixe vide :

; The first category is the null prefix (has a null gloss as well):
		Pref-0	
		

... où seule apparaît la catégorie morphologique.

Suffixes

Examinons maintenant ce fragment du dictionnaire de suffixes gpl/pierrick/brihaye/aramorph/dictionaries/dictSuffixes :

; perfect verb, null suffix: banA-h, daEA-h
h	hu	PVSuff-0ah	he/it <verb> it/him        <pos>+(null)/PVSUFF_SUBJ:3MS+hu/PVSUFF_DO:3MS</pos>
hmA	humA	PVSuff-0ah	he/it <verb> them (both)   <pos>+(null)/PVSUFF_SUBJ:3MS+humA/PVSUFF_DO:3D</pos>
hm	hum	PVSuff-0ah	he/it <verb> them          <pos>+(null)/PVSUFF_SUBJ:3MS+hum/PVSUFF_DO:3MP</pos>
hA	hA	PVSuff-0ah	he/it <verb> it/them/her   <pos>+(null)/PVSUFF_SUBJ:3MS+hA/PVSUFF_DO:3FS</pos>
hn	hun~a	PVSuff-0ah	he/it <verb> them          <pos>+(null)/PVSUFF_SUBJ:3MS+hun~a/PVSUFF_DO:3FP</pos>
k	ka	PVSuff-0ah	he/it <verb> you           <pos>+(null)/PVSUFF_SUBJ:3MS+ka/PVSUFF_DO:2MS</pos>
k	ki	PVSuff-0ah	he/it <verb> you           <pos>+(null)/PVSUFF_SUBJ:3MS+ki/PVSUFF_DO:2FS</pos>
kmA	kumA	PVSuff-0ah	he/it <verb> you (both)    <pos>+(null)/PVSUFF_SUBJ:3MS+kumA/PVSUFF_DO:2D</pos>
km	kum	PVSuff-0ah	he/it <verb> you           <pos>+(null)/PVSUFF_SUBJ:3MS+kum/PVSUFF_DO:2MP</pos>
kn	kun~a	PVSuff-0ah	he/it <verb> you           <pos>+(null)/PVSUFF_SUBJ:3MS+kun~a/PVSUFF_DO:2FP</pos>
ny	niy	PVSuff-0ah	he/it <verb> me            <pos>+(null)/PVSUFF_SUBJ:3MS+niy/PVSUFF_DO:1S</pos>
nA	nA	PVSuff-0ah	he/it <verb> us            <pos>+(null)/PVSUFF_SUBJ:3MS+nA/PVSUFF_DO:1P</pos>
		

Le principe est strictement le même, bien que l'exemple soit légèrement plus complexe. On a en effet une double succession de suffixes, le premier étant le suffixe Ø de la troisième personne singulier masculin de l'accompli, le second étant relatif à un objet direct pronominal. On notera le + de liaison avec le radical puis le + de liaison avec le suffixe Ø.

Radicaux

Examinons ce fragment du dictionnaire de radicaux gpl/pierrick/brihaye/aramorph/dictionaries/dictstems :

;
;--- ktb
;; katab-u_1
ktb	katab	PV	write
ktb	kotub	IV	write
ktb	kutib	PV_Pass	be written;be fated;be destined
ktb	kotab	IV_Pass_yu	be written;be fated;be destined
;; kAtab_1
kAtb	kAtab	PV	correspond with
kAtb	kAtib	IV_yu	correspond with
;; >akotab_1
>ktb	>akotab	PV	dictate;make write
Aktb	>akotab	PV	dictate;make write
ktb	kotib	IV_yu	dictate;make write
ktb	kotab	IV_Pass_yu	be dictated
;; takAtab_1
tkAtb	takAtab	PV	correspond
tkAtb	takAtab	IV	correspond
;; {inokatab_1
<nktb	{inokatab	PV	subscribe
Anktb	{inokatab	PV	subscribe
nktb	nokatib	IV	subscribe
;; {ikotatab_1
<kttb	{ikotatab	PV	register;enroll
Akttb	{ikotatab	PV	register;enroll
kttb	kotatib	IV	register;enroll
;; {isotakotab_1
<stktb	{isotakotab	PV	make write;dictate
Astktb	{isotakotab	PV	make write;dictate
stktb	sotakotib	IV	make write;dictate
;; kitAb_1
ktAb	kitAb	Ndu	book
ktb	kutub	N	books
;; kitAboxAnap_1
ktAbxAn	kitAboxAn	NapAt	library;bookstore
ktbxAn	kutuboxAn	NapAt	library;bookstore
;; kutubiy~_1
ktby	kutubiy~	Ndu	book-related
;; kutubiy~_2
ktby	kutubiy~	Ndu	bookseller
ktby	kutubiy~	Nap	booksellers     <pos>kutubiy~/NOUN</pos>
;; kut~Ab_1
ktAb	kut~Ab	N	kuttab (village school);Quran school
ktAtyb	katAtiyb	Ndip	kuttab (village schools);Quran schools
;; kutay~ib_1
ktyb	kutay~ib	NduAt	booklet
;; kitAbap_1
ktAb	kitAb	Nap	writing
;; kitAbap_2
ktAb	kitAb	Napdu	essay;piece of writing
ktAb	kitAb	NAt	writings;essays
;; kitAbiy~_1
ktAby	kitAbiy~	N-ap	writing;written     <pos>kitAbiy~/ADJ</pos>
;; katiybap_1
ktyb	katiyb	Napdu	brigade;squadron;corps
ktA}b	katA}ib	Ndip	brigades;squadrons;corps
ktA}b	katA}ib	Ndip	Phalangists
;; katA}ibiy~_1
ktA}by	katA}ibiy~	Nall	brigade;corps     <pos>katA}ibiy~/NOUN</pos>
ktA}by	katA}ibiy~	Nall	brigade;corps     <pos>katA}ibiy~/ADJ</pos>
;; katA}ibiy~_2
ktA}by	katA}ibiy~	Nall	Phalangist     <pos>katA}ibiy~/NOUN</pos>
ktA}by	katA}ibiy~	Nall	Phalangist     <pos>katA}ibiy~/ADJ</pos>
;; makotab_1
mktb	makotab	Ndu	bureau;office;department
mkAtb	makAtib	Ndip	bureaus;offices
;; makotabiy~_1
mktby	makotabiy~	N-ap	office     <pos>makotabiy~/ADJ</pos>
;; makotabap_1
mktb	makotab	NapAt	library;bookstore
mkAtb	makAtib	Ndip	libraries;bookstores
;; mikotAb_1
mktAb	mikotAb	Ndu	printer
;; mukAtabap_1
mkAtb	mukAtab	NapAt	correspondence
;; {ikotitAb_1
<kttAb	{ikotitAb	N/At	enrollment;registration;subscription
AkttAb	{ikotitAb	N/At	enrollment;registration;subscription
;; {isotikotAb_1
<stktAb	{isotikotAb	N/At	dictation
AstktAb	{isotikotAb	N/At	dictation
<stktAby	{isotikotAbiy~	N-ap	dictation     <pos>{isotikotAbiy~/ADJ</pos>
AstktAby	{isotikotAbiy~	N-ap	dictation     <pos>{isotikotAbiy~/ADJ</pos>
;; kAtib_1
kAtb	kAtib	N/ap	writer;author
kAtb	kAtib	N/ap	clerk
ktAb	kut~Ab	N	authors;writers
ktb	katab	Nap	authors;writers
;; kAtib_2
kAtb	kAtib	Nall	writing     <pos>kAtib/ADJ</pos>
;; makotuwb_1
mktwb	makotuwb	N-ap	written     <pos>makotuwb/ADJ</pos>
;; makotuwb_2
mktwb	makotuwb	Ndu	letter;message
mkAtyb	makAtiyb	Ndip	letters;messages
;; mukAtib_1
mkAtb	mukAtib	Nall	correspondent;reporter
;; mukotatib_1
mkttb	mukotatib	Nall	subscriber
;		
		

Le format est très légèrement différent puisqu'une ligne commençant par ;; donne un identifiant de lemme. Tout le reste est néanmoins similaire.

On remarquera que la catégorie grammaticale est souvent absente car elle peut être extrapolée à partir de la catégorie morphologique. On notera cependant quelques exemples où la catégorie grammaticale doit être précisée car une catégorie morphologique comme une nisba, morphologicalement nominale, peut donner lieu à des utilisations adjectivales.

Note
On remarque l'omniprésence de translitérations selon le système de Buckwalter.
Fixme (vous !)
Je suis à la recherche de scripts Perl qui permettraient la traduction de ce format texte vers XML (si possible en UTF-8 afin de pouvoir intégrer tous types de glosses, en particulier celles utilisant des caractères accentués européens comme Védrine ou Schröder) et vice-versa.
Ceci permettrait de traiter les dictionnaires directement en arabe plutôt que par l'intermédiaire du système de translitération de Buckwalter et permettrait d'exploiter le support Unicode natif de Java.
La version 2.0 de la version Perl d'Aramorph, utilise des dictionnaires en XML, mais elle n'est malheureusement pas en GPL.