Gedcom:Gedcom-Names-ohjelma

From wikitammi

Gedcom työkalu Henkilönimet

in English På svenska

Tarkoitus

Suomi-tietokannan koostamisessa aineistojen henkilönimiaineistoa on esikäsiteltävä yleensä aina, jotta eri tutkijoiden aineistoista tulevat tiedot ovat yhteismitallisia ja aineisto soveltuu päällekkäisten henkilöiden löytämiseen ja tietokantaistukseen.

Isotammen Henkilönimet-työkalulla tutkija voi itse tehokkaasti muokata gedcom-tiedostossaan olevia henkilönimitietoja. Muunnoksilla ei ole kielipoliittisia tavoitteita. Hyvän tutkimuskäytännön mukaisesti tutkijan on itse huolehdittava siitä, että tallentaa nimet lähteiden mukaisella kielellä ja vain lähteistä löytyviä patronyymeja ja sukunimiä.

Viimeistään Grampsissä on vaihtoehtoisiin nimiin liitettävä oikea tyyppitieto ja lähdeviittaus. Sen voi tietenkin tehdä myös tutkijan muussa sukututkimusohjelmassa, jos ohjelma tukee vaihtoehtoisia tyypitettyjä nimiä lähdeviitteinen ja jos ohjelma siirtää tiedot oikein gedcom-tiedostoon.

Työkalun käyttö

Valitse Isotammen gedcom-työkaluista "Henkilönimet" Rastita asetus "Näytä muutetut rivit" (valinnainen) Suorita muunnos.

Tarkista muunnoksen tulokset sivun alaosasta.

Jos olet muunnokseen tyytyväinen, käytä painiketta "Tallenna tulos", jolloin aikaisempi gedcom-tiedostosi saa uuden versionumero (.0) ja muunnettu gedcom-tiedosto tallennetaan aikaisemman gedcom-tiedoston versionumerolla. Jos et halua tallentaa muunnettua gedcom-tiedostoa, poistu gedcom-työkaluista tai aja jokin muu muunnos.

Käsittelyn periaatteet

Tutkijan käyttämästä sukututkimusohjelmasta ja tutkijan käytänteistä riippuu, miten tutkijan kirjaamat henkilönimien tiedot ovat sijoittuneet ohjelman tulostamaan gedcom-tiedostoon. Isotammen Henkilönimet-työkalu vakioi nimiaineiston rakenteisesti ja osin sisällöltään.

Puuttuva etu- tai sukunimi

NAME-rivillä oletetaan olevan sekä etu- että sukunimet. Jos etunimeä tai sukunimeä ei ole, puuttuva arvo merkitään "N":llä.

Jos etunimenä on jokin seuraavista:

{ "vauva":"U", "poikavauva":"M", "tyttövauva":"F", 
  "poikalapsi":"M", "tyttölapsi":"F", "lapsi":"U",
  "fröken":"F", "junfru":"F", "herr":"M", 
  "neiti":"F", "rouva":"F", "herra":"M", 
  "(vauva)":"U", "(poikavauva)":"M", "(tyttövauva)":"F", 
  "(poikalapsi)":"M", "(tyttölapsi)":"F", "(lapsi)":"U",
  "barn":"U", "son":"M", "gåsse":"M", 
  "dotter":"F", "flicke":"F", "fl.barn":"U", "dödf.barn":"U",
  "(barn)":"U", "(son)":"M", "(gåsse)":"M", 
  "(dotter)":"F", "(flicke)":"F", "(fl.barn)":"U", "(dödf.barn)":"U" }

nimi korvataan "N":llä ja sukupuoli lisätään tagilla SEX jos se ei ole "U" (tuntematon).

Esimerkiksi Sukujutut merkitsee avionimen ilman etunimiä. Tällöin oletetaan, että edelliset etunimet pätevät.

Patronyymi ja Matronyymi

Patronyymi tunnistetaan nimen loppuosasta. Jos patronyymimuotoinen etunimi löytyy jostain nimenosasta, mahdollinen lyhenne täydennetään, se siirretään jälkiliitteeksi ja lisäksi tulostetaan SPFX-rivi. Samoin toimitaan matronyymin kanssa.

Muunnossäännöt:

patronyymi tulostetaan
poika', 'p.' 'poika'
'sson', 'ss.' 'sson'
's.' 'son'
'tytär', 't.' 'tytär'
'dotter':'dr.' 'dotter'

Etunimen muut säännöt

Kutsumanimi Gedcom-standardi ei tunne kutsumanimen käsitettä. Suomalaiset sukututkimusohjelmat tunnistavat sen yleensä tähti-merkinnästä. Näin suomalaisissa gedcom-aineistoissa Kutsumanimi voi olla merkitty nimen perässä olevalla tähdellä '*'.

Tähti poistetaan ja siitä tulostetaan gedcom-tiedostoon lisätietorivi NOTE _CALL .... Nämä lisätiedot on haettavissa Grampsissa, jossa tutkija voi niistä kirjata henkilölle Kutsumanimen oikeaan kenttäänsä.

Lempinimi voi olla suluissa: "Mats (Matti)". Se poistetaan etunimistä ja siitä tulostetaan NICK -tagillä varustettu rivi

Nimetön lapsi voi olla merkitty sanoilla "vauva", "poikavauva", "tyttövauva", "poikalapsi", "tyttölapsi", "lapsi", tai samoilla sanoilla suluissa. Nämä korvataan nimetön-merkinnällä "N" etunimen kohdalla.

Sukunimi-osa

Sukunimitieto on NAME-rivillä kauttaviivojen välissä. Jos sukunimi-tietoon on kirjattu tietoja henkilön useista sukunimistä, ne tunnistetaan ao. sukunimen edessä olevista tyyppitiedoista. Kustakin sukunimestä tulostetaan gedcom-tiedostoon oma "1 NAME"-rive, jonka alla sukunimen tyyppi on "2 TYPE arvo" -rivillä.

Ohjelma tunnistaa seuraavat sukunimen erottimet eli tyypin määritykset:

erotin "Aaltonen <erotin> Behm" tulostaa
'os.', 'o.s.' Behm avionimi Aaltonen
'ent.', 'e.' Behm otettu nimi Aaltonen
'/', ',' Aaltonen tunnettu myös Behm

Käsittelystä tarkemmin:

  1. Nimet käsitellään lopusta alkuun. Viimeinen nimi on syntymänimi, jolle ei merkitä tyyppiä
  2. Nimet muunnetaan pikkukirjaimille, paitsi iso alkukirjain
  3. "Aaltonen (Behm)" käsitellään kuten "Aaltonen/Behm" eli tuottaa "Aaltonen; tunnettu myös Behm" (huom nimien järjestys)
  4. Jos mitään erotinta ei tunnisteta, tulkitaan, että tämä sukunimi koostuu kahdesta sanasta.
  5. Jos monisanaisen sukunimen etuosa on enintään kolmikirjaiminen eikä sisälläpistettä pistettä, sen uskotaan olevan aatelisnimien etuliite ("von" yms.), joka siirretään SPFX-riviksi.

Esimerkiksi nimestä "Raija/Reipas e. Frisk os. Laine/" muodostetaan lopusta alkaen kolme nimen kuvausta, josta ensimmäinen tässä järjestyksessä on syntymänimi:

  • "Raija/Laine/" (tyyppiä ei merkitä)
  • "Raija/Frisk/" TYPE="avionimi"
  • "Raija/Reipas/" TYPE="otettu"

Jos muokattu NAME poikkeaa alkuperäisestä muuten kuin tyhjämerkkien osalta, lisätään huomautusrivi 2 NOTE orig_NAME ....

Teknisiä lähtökohtia

Merkistö

Oletuksena syötteen merkistö on UTF-8.

Nimiosiot

Gedcom-tiedostossa Henkilötieto alkaa 0 @I0000@ INDI -riviltä, jonka alla on nimikuvauksia, jotka alkavat 1 NAME Etu/Suku/Patronyymi -rivillä.

Henkilöä kohti voi olla useita nimikuvauksia, esim. yksi syntymänimelle ja toinen avionimelle.

Standardi määrittelee nimitiedon seuraavasti:

PERSONAL_NAME_STRUCTURE:=
n NAME <NAME_PERSONAL>
+1 NPFX <NAME_PIECE_PREFIX> 
+1 GIVN <NAME_PIECE_GIVEN> etunimet
+1 NICK <NAME_PIECE_NICKNAME> kutsumanimi
+1 SPFX <NAME_PIECE_SURNAME_PREFIX sukunimen etuliite" kuten 'von'. Ei käytetä lajittelussa.
+1 SURN <NAME_PIECE_SURNAME sukunimi ilman etuliitettä
+1 <<SOURCE_CITATION>> nimeen liitetty lähdeviite
+1 <<NOTE_STRUCTURE>> nimeen liitetty lisätieto

Varsinaisen NAME-rivin tietoja pidetään ensisijaisena tietolähteenä, mutta myös muissa tageissä olleet tiedot pyritään huomioimaan.

Myös sukunimen kohdalla voi olla monta nimeä, joista kustakin tehdään oma NAME-kuvaus.

Henkilön usesta nimestä pidetään ensisijaisena ensimmäisen NAME-rivin viimestä nimeä, jonka pitäisi olla syntymänimi. Esimerkissä 1 NAME Raija /Reipas e. Frisk os. Laine/" nimi "Raija Laine" on hänen ensisijainen nimensä, johon liitetään syöttöaineistossa mahdollisesti tulleet attribuutit kuten huomautukset, lähdetiedot ja kutsumanimet.

Lisäksi NOTE- ja SOUR- määritykset ovat sallittuja lähes mille tahansa riville.

NAME-rivi

NAME-rivi oletetaan olevan muodossa 1 NAME Etunimet/Sukunimet/Jälkiliite. Jos kauttaviivoja ei löydy, tietoihin ei kosketa.

Jälkiliitteeseen sijoitetaan patronyymitieto Suomi-tietokantaa varten, koska sille ei ole gedcom-standardissa omaa paikkaansa.

Gedcom-standardin mukaan useat etunimet tai sukunimet on erotettu toisistaan pilkulla, mutta käytännössä etunimien väleissä ei käytetä pilkkuja.

Gedcomin käsittely

NAME

NAME_PERSONAL:= [ <TEXT> | /<TEXT>/ | <TEXT> /<TEXT>/ | /<TEXT>/ <TEXT> | <TEXT> /<TEXT>/ <TEXT> ]

NAME-rivi oletetaan olevan muodossa 1 NAME Etunimet/Sukunimet/Jälkiliite, jossa jälkiliitteeseen on tarkoitus sijoittaa patronyymitieto. Jos kauttaviivoja ei löydy, tietoihin ei kosketa.

Standardin 5.5 mukaan esimerkiksi useat etunimet tai sukunimet on erotettu toisistaan pilkulla, mutta käytännössä emme tätä aina vaadi (esim. etunimien väleissä ei käytetä pilkkuja).

TODO Näille tarvitaan vastaavat ruotsinkieliset lyhenteet

Jälkiliite eli patronyymiosa

Jos nimen osassa on jo tietoa, gedcom-työkalu ei kirjoita sen päälle patronyymitietoa.

TODO Kirjoitta tässä tapauksessa patronyymi NOTE Patronyymi "tieto" lisätiedoksi

NAMEn alaiset tagit

Luetut NAME-riviä seuraavat sille alisteiset rivit liitetään ensimmäisenä tulostettavaan ensisijaiseen nimeen ja sen aliriveihin.

Jälkiliite voi olla NAME-tagin asemasta esitettynä pelkästään NPFX-tagilla. Sille ei tehdä mitään.

Epästandardi ALIA tagi

Standardista poiketen joissakin ohjelmissa ilmaistaan tagilla ALIA rinnakkainen nimi, esim. "1 ALIA Nätti-Jussi". Tällaisen nimen rakenne ei ole sama kuin NAME-rivillä.

Sukujutut-ohjelma saattaa tulostaa avionimen ALIA-tagilla, ellei käyttäjä ole valinnut vahtoehtoa "käytä NAME-tagia".

TODO Jos havaitaan ALIA -rivi, jossa on nimi, siitä tehdään NAME tyyppiä AKA, "tunnettu myös".

Esikäsittely

TODO Ennen muuta käsittelyä on tarkoitus tehdä ainakin NAME-riville seuraavaa –

  • patronyymi kahdella sanalla yhditetään: "Matin poika" --> "Matinpoika"