Coimpiutairean a’ faighinn greim air a’ Ghàidhlig le teigneòlas ùr

A porcelain phrenology head used in psychology

A porcelain phrenology head used in psychology

Share this article
0
Have your say

Chaidh inneal coimpiutaireachd, goireas air-loidhne agus stòr-data de theagsaichean a chur air bhog o chionn ghoirid.

Tha eòlaichean ag ràdh gum bi iad nan taic gus Gàidhlig na h-Alba a dhèanamh tèarainte san linn dhigeataich.

Bheir an t-inneal cuideachadh do choimpiutairean a bhith a’ tuigsinn na Gàidhlig, agus faodar a chleachdadh airson diofar ghnìomhan, leithid aithne-gutha (speech recognition) agus eadar-theangachadh air-loidhne, a bharrachd air ceartachadh litreachaidh is gràmair. Tha na h-eòlaichean cànain agus coimpiutaireachd a leasaich an teigneòlas ag ràdh gu bheil aplacaidean na chois a chuidicheas daoine le bhith a’ tuigsinn agus ag ionnsachadh a’ chànain.

Chleachd an luchd-sgrùdaidh stòr-dàta de chòrr is 100,000 facal airson riaghailtean gràmar na Gàidhlig ionnsachadh dhan choimpiutair. Leasaich iad aplacaid ris an canar tagair gramataigeach no part-of-speech (POS) tagger. Leigidh an tagair seo le coimpiutairean facal a chur ris a’ bhileig (tag) ghràmair aige, leithid ainmeir, gnìomhair no buadhair. Mar eisimpleir, nan cuirte an seantans ‘tha an latha eireachdail’ a-steach dhan tagair, dh’aithnicheadh an coimpiutair gun e gnìomhair a th’ ann an ‘tha’, alt ann an ‘an’, ainmear ann an ‘latha’ agus buadhair ann an ‘eireachdail’. Thigeadh e air ais le facal agus bileag ghràmair ma seach:

[[“tha”, “V-p”], [“an”, “Tdsm”], [“latha”, “Ncsmn”], [“eireachdail”, “Ap”]]

Tha an sgioba ag ràdh gun toir an t-inneal seo cuideachadh dha na coimpiutairean le bhith a’ seòrsachadh agus ag òrdanachadh a’ chànain – prìomh phròsas ann an aplacaidean digeatach, leithid cainnt a tha air a gineadh le coimpiutair. Ged a chaidh innealan POS a leasachadh airson grunn chànanan eile, is e seo a’ chiad teigneòlas cànain dhe a leithid a chaidh a dhearbhadh airson Gàidhlig na h-Alba.

Tha Oilthigh Napier Dhùn Èideann air an t-inneal a thairgsinn air an Eadar-lìon mar dhuilleig-lìn. Mar sin, faodar a chleachdadh gun a bhith ga luchdadh a-nuas, agus gun eòlas air prògramadh coimpiutaireachd. ’S e a’ bhuannachd eile a tha Napier a’ tairgsinn gu bheil an t-inneal uabhasach luath, is e air a chumail air na coimpiutairean adhartach aca.

A bharrachd air an tagair agus air an làraich-lìn, chuir na h-eòlaichean stòr-data de theagsaidhean Gàidhlig no ‘corpas’ air bhog leis an ainm ARCOSG no Annotated Reference Corpus of Scottish Gaelic. Tha an corpas a’ toirt seachad bileag ghràmair ri taobh a h-uile facail. Bidh seo mar an ceudna na bhuannachd airson caochladh seòrsa rannsachaidh agus ghnìomhan ann an cànanachas agus teigneòlas cànain.

Mar eisimpleir, chaidh pàirt de dh’ARCOSG a chleachdadh airson a’ chiad ghutha fhuadain Ghàidhlig, ‘Ceitidh’, a chaidh a leasachadh le Cereproc (Oilthigh Dhùn Èideann) o chionn ghoirid. Dh’fhaodadh an corpas cuideachd a bhith na thaic do luchd-ionnsachaidh, is iad a’ sireadh eisimpleirean de Ghàidhlig nàdarra, leithid còmhraidh san taigh.

Chaidh na toraidhean a leasachadh le luchd-sgrùdaidh aig Oilthigh Dhùn Èideann (Ceiltis is Eòlas na h-Alba), le taic bho Oilthighean Obar Dheathain is Ghlaschu, Oilthigh Napier Dhùn Èideann agus Sabhal Mòr Ostaig san Eilean Sgitheanach a tha na phàirt de dh’Oilthigh na Gàidhealtachd ’s nan Eilean.

Fhuair am pròiseact taic airgid bho Bhòrd na Gàidhlig agus bho Urras Carnegie airson Oilthighean na h-Alba. Chaidh toraidhean a’ phròiseict a chur air bhog aig a’ cho-labhairt sgrùdaidh, Rannsachadh na Gàidhlig, aig Sabhal Mòr Ostaig san Eilean Sgìtheanach, air Dihaoine 24 Ògmhios.

Thuirt an Dr Uilleam Lamb, bho Cheiltis is Eòlas na h-Alba (Oilthigh Dhùn Èideann): “’S ann aig ìre glè thràth a tha teigneòlas corpais is cànain airson Gàidhlig na h-Alba, an taca ri na ceumannan mòra a tha air a bhith gan gabhail airson chànanan eile san raon seo anns na deicheadan a dh’fhalbh. Tha am pròiseact againn a’ toirt seachad cothrom gus an suidheachadh seo a cheartachadh agus gus an cànan a thoirt air adhart – le gluasad teigneòlais a tha fìor riatanach – a-steach dhan aona linn fichead.”

• Ceanglaichean: ARCOSG: http://dx.doi.org/10.7488/ds/1411 | Tagair Gramataigeach na Gàidhlig: https://razorfish17@bitbucket.org/gaelic_nlp/gaelic_pos.git

A’ Choinneamh Mhòr

Am bheil Frangach no Sasunnach no Albannach leis nach caomh cainnt a dhùthcha? Is dòcha nach eil, agus ged a bhitheadh cha bhiodh e ’na dhearbhadh ach air aon nì - gu’m bheil an cridhe cealgach agus anabarrach neo-chinnteach.

Is nàdurra do na h-uile neach bàigh a bhi aige ri dhùthaich, ri mhuinntir agus ri chànain féin. Is ann riù so a chaidh a thogail agus is e an càirdeas a nì sinn òg is faide leanas ruinn. Tha sinn a’ cruinneachadh air an ath mhìos a chum taice chumail ris a’ Ghàidhlig, oir tha i fad o bhi an slàinte chothromaich. Théid na tréibhean suas gu léir agus bidh éibhneas air bail’ Inbhir-nis cho fad ’sa mhaireas féisd mhór ar cànain an taobh a staigh d’a bhallachan. Tha dòchas gu’n tig feum ás na coinneamhan so agus gu’m mair a’ Ghàidhlig greis mhath mu’n téid i air a casan deiridh. Tha i an deagh chailm anns na h-Eileanan is faide mach agus an earrannan de thìr-mór, ach chan eil i cho math ’sa ghuidheamaid dhith an àite ’sam bith eile. Tha an sluagh, mar an ceudna, a’ ruith am mach, agus eadar a h-uile rud a th’ ann, is iomadh nì a bhios a’ cur campar agus smalan air muinntir a’ Mhòid.

Tha sinn an dòchas gu’m bi naidheachd mhath aca an uair a thilleas iad dhachaidh agus gu’m bi e comasach dhaibh a ràdh gu’m bum hath do’n Ghàidhlig iad a bhi an sud. Ma bhitheas, bidh gean air na h-uile.

Gaelic guide for learners

Let’s look at some simple sentence structures that can get you to speak Gaelic in minutes. Gaelic sentences start with the verb and we will use the verb bi, to be. In the present tense in positive sentences, this is tha. After that add a name or a noun or a personal pronoun:

Tha Eilidh … - Eilidh is …

Tha am ministear … - The minister is …

Tha mi … I am …

You can see that the verb does not change; it is tha for ‘is’, ‘am’, and ‘are’ . You can then add an adjective or a verbal noun. A verbal noun corresponds to the -ing-form of verbs in English.

Tha Eilidh glic. Eilidh is smart.

Tha sinn sgìth. We are tired.

Tha am ministear a’ bruidhinn. The minister is speaking.

Tha mi a’ seinn. I am singing.

To make this a negative sentence, simply substitute tha with chan eil:

Chan eil sinn sgìth. We are not tired.

Chan eil mi a’ seinn. I am not singing.

To make it into a question, substitute it by a bheil:

A bheil Eilidh glic? Is Eilidh smart?

A bheil am ministear a’ bruidhinn? Is the minister speaking?

Next week, we will look at the past and future tense of bi.

• Sabhal Mòr Ostaig offers Gaelic learning opportunities at the College and by distance-learning. {www. smo.uhi.ac.uk|www. smo.uhi.ac.uk|link to site}

Place name of the week

Aviemore - An Aghaidh Mhòr

Today the Gaelic form of the popular holiday destination Aviemore is An Aghaidh Mhòr ‘the big face’, and this can be seen on the wooden sign at the train station. One hundred years ago, however, the form of the name was Agaidh Mhòr ‘big Agaidh’. The meaning of the element agaidh is not known, although it possibly relates to eag ‘notch’ or ‘cleft’. Be that is it may, agaidh also appears nearby in the name Avielochan - Agaidh an Lochain ‘the agaidh of the little loch’. The element also possibly appears in the names Blargie - Blàragaidh and Gallovie - Gealagaidh.

When Gaelic was in decline in the area, some said Aviemore was in Gaelic A’ Ghaoth Mhòr ‘the big wind’. This form is of course fanciful, as it neither makes sense as a name, nor does it match the stress pattern of the English form.

• For more information on this name visit www.ainmean-aite.org

Back to the top of the page