ANSI eller ANSEL?
Moderator: MOD_nyhetsgrupper
ANSI eller ANSEL?
Jeg vet det har vært spurt om før, men jeg har glemt hvilket tegnsett man
skal bruke når man lager en GEDCOM-fil og vil ha med særnorske bokstaver.
Kan noen svare meg forholdsvis raskt?
--
mvh
Inger
skal bruke når man lager en GEDCOM-fil og vil ha med særnorske bokstaver.
Kan noen svare meg forholdsvis raskt?
--
mvh
Inger
Re: ANSI eller ANSEL?
On Fri, 3 Sep 2004 11:31:36 +0200, in no.fritid.slektsforsking.it
"Inger Eik" <[email protected]> wrote:
begge skal kunne gå like greit og uten problemer
i GEDCOM5.5 står Chapter 3 Using Character Sets in GEDCOM
http://homepages.rootsweb.com/~pmcbride ... 5gcch3.htm
GEDCOM needs to accommodate different character sets to facilitate the
sharing of genealogical data in different languages. To minimize the
number of differing standards, we have chosen to have each system
convert its usage to ANSEL, and eventually to UNICODE.
--
Otto Jørgensen
http://home.online.no/~otjoerge/bk/
All email is checked by NORTON
"Inger Eik" <[email protected]> wrote:
Jeg vet det har vært spurt om før, men jeg har glemt hvilket tegnsett man
skal bruke når man lager en GEDCOM-fil og vil ha med særnorske bokstaver.
Kan noen svare meg forholdsvis raskt?
begge skal kunne gå like greit og uten problemer
i GEDCOM5.5 står Chapter 3 Using Character Sets in GEDCOM
http://homepages.rootsweb.com/~pmcbride ... 5gcch3.htm
GEDCOM needs to accommodate different character sets to facilitate the
sharing of genealogical data in different languages. To minimize the
number of differing standards, we have chosen to have each system
convert its usage to ANSEL, and eventually to UNICODE.
--
Otto Jørgensen
http://home.online.no/~otjoerge/bk/
All email is checked by NORTON
Re: ANSI eller ANSEL?
"Otto Jørgensen" <otjoerge%øføø%@online.norway> skrev i melding
news:[email protected]...
--
mvh
Inger
news:[email protected]...
On Fri, 3 Sep 2004 11:31:36 +0200, in no.fritid.slektsforsking.it
"Inger Eik" <[email protected]> wrote:
Jeg vet det har vært spurt om før, men jeg har glemt hvilket tegnsett man
skal bruke når man lager en GEDCOM-fil og vil ha med særnorske bokstaver.
Kan noen svare meg forholdsvis raskt?
begge skal kunne gå like greit og uten problemer
i GEDCOM5.5 står Chapter 3 Using Character Sets in GEDCOM
http://homepages.rootsweb.com/~pmcbride ... 5gcch3.htm
GEDCOM needs to accommodate different character sets to facilitate the
sharing of genealogical data in different languages. To minimize the
number of differing standards, we have chosen to have each system
convert its usage to ANSEL, and eventually to UNICODE.
Takk skal du ha!
--
mvh
Inger
Re: ANSI eller ANSEL?
"Inger Eik" <[email protected]> wrote in message
news:[email protected]...
Jeg har akkurat eksportert hele databasen min som en GEDCOM for å legge ut
dataene på en interaktiv web-side. Originalbasen er BK i siste versjon. Det
programmet som tar imot heter phpGedView og kjører på en Linux server.
For å få med alle norske, svenske og spanske tegn (ja, jeg har viss noe
slekt der også) forsøkte jeg først med ANSEL, men måtte endre til ANSI. Selv
om dem som ligger bak GEDCOM standarden har landet på ANSEL så tror jeg det
fremdeles henger en del sammen med hvilket OS miljø det eksporteres fra og
til hvilket OS det skal over på.
Akkurat phpGedView kom faktisk med en melding om at ANSEL var detektert og
om jeg ville konverete. Selv om jeg sa Ja til det så ble det altså ikke noe
æøå ved første forsøk.
Konklusjon: Forsøk til det stemmer.
John Morten
news:[email protected]...
Jeg vet det har vært spurt om før, men jeg har glemt hvilket tegnsett man
skal bruke når man lager en GEDCOM-fil og vil ha med særnorske bokstaver.
Kan noen svare meg forholdsvis raskt?
--
Jeg har akkurat eksportert hele databasen min som en GEDCOM for å legge ut
dataene på en interaktiv web-side. Originalbasen er BK i siste versjon. Det
programmet som tar imot heter phpGedView og kjører på en Linux server.
For å få med alle norske, svenske og spanske tegn (ja, jeg har viss noe
slekt der også) forsøkte jeg først med ANSEL, men måtte endre til ANSI. Selv
om dem som ligger bak GEDCOM standarden har landet på ANSEL så tror jeg det
fremdeles henger en del sammen med hvilket OS miljø det eksporteres fra og
til hvilket OS det skal over på.
Akkurat phpGedView kom faktisk med en melding om at ANSEL var detektert og
om jeg ville konverete. Selv om jeg sa Ja til det så ble det altså ikke noe
æøå ved første forsøk.
Konklusjon: Forsøk til det stemmer.
John Morten
Re: ANSI eller ANSEL?
"John Morten Malerbakken"
<[email protected]> wrote in
message news:[email protected]...
På denne side (http://phpgedview.sourceforge.net/faq.php#convert) står der
en lille beskrivelse af hvorledes du konverterer fra ANSI eller ANSEL til
UTF-8, som er det format som phpGedView anvender.
- Jesper Holgersen (http://jesper.familien-holgersen.dk/)
<[email protected]> wrote in
message news:[email protected]...
Jeg har akkurat eksportert hele databasen min som en GEDCOM for å legge ut
dataene på en interaktiv web-side. Originalbasen er BK i siste versjon.
Det
programmet som tar imot heter phpGedView og kjører på en Linux server.
For å få med alle norske, svenske og spanske tegn (ja, jeg har viss noe
slekt der også) forsøkte jeg først med ANSEL, men måtte endre til ANSI.
Selv
om dem som ligger bak GEDCOM standarden har landet på ANSEL så tror jeg
det
fremdeles henger en del sammen med hvilket OS miljø det eksporteres fra og
til hvilket OS det skal over på.
Akkurat phpGedView kom faktisk med en melding om at ANSEL var detektert og
om jeg ville konverete. Selv om jeg sa Ja til det så ble det altså ikke
noe
æøå ved første forsøk.
På denne side (http://phpgedview.sourceforge.net/faq.php#convert) står der
en lille beskrivelse af hvorledes du konverterer fra ANSI eller ANSEL til
UTF-8, som er det format som phpGedView anvender.
Konklusjon: Forsøk til det stemmer.
John Morten
- Jesper Holgersen (http://jesper.familien-holgersen.dk/)
Re: ANSI eller ANSEL?
On Sun, 5 Sep 2004 10:21:26 +0200, in no.fritid.slektsforsking.it
"Jesper Holgersen" <[email protected]> wrote:
kan man ikke i grunnen si at problemet er at programmet ikke følger
anbefalingen til GEDCOM5.5 som jo anbefaler i hovedsak ANSEL uansett
om programmene i tillegg også kan handtere andre formater?
--
Otto Jørgensen
http://home.online.no/~otjoerge/bk/
All email is checked by NORTON
"Jesper Holgersen" <[email protected]> wrote:
På denne side (http://phpgedview.sourceforge.net/faq.php#convert) står der
en lille beskrivelse af hvorledes du konverterer fra ANSI eller ANSEL til
UTF-8, som er det format som phpGedView anvender.
kan man ikke i grunnen si at problemet er at programmet ikke følger
anbefalingen til GEDCOM5.5 som jo anbefaler i hovedsak ANSEL uansett
om programmene i tillegg også kan handtere andre formater?
--
Otto Jørgensen
http://home.online.no/~otjoerge/bk/
All email is checked by NORTON
Re: ANSI eller ANSEL?
On Mon, 06 Sep 2004 00:00:53 +0200, Otto Jørgensen
<otjoerge%øføø%@online.norway> wrote:
Problemet er at Linux ikke støtter hverken ANSI eller AnSEL.
<otjoerge%øføø%@online.norway> wrote:
kan man ikke i grunnen si at problemet er at programmet ikke følger
anbefalingen til GEDCOM5.5 som jo anbefaler i hovedsak ANSEL uansett
om programmene i tillegg også kan handtere andre formater?
Problemet er at Linux ikke støtter hverken ANSI eller AnSEL.
Re: ANSI eller ANSEL?
On Mon, 06 Sep 2004 17:37:48 +0200, in no.fritid.slektsforsking.it Alf
Christophersen <[email protected]> wrote:
tja, det er jo problem for dette systemet når de skal forholde seg til
GEDCOM5.5
Slik at problemet er jo i grunnen ikke avgivende system men at det for
det mottakende system er laget noe som handterer en vanlig GEDCOM-fil
--
Otto Jørgensen
http://home.online.no/~otjoerge/bk/
All email is checked by NORTON
Christophersen <[email protected]> wrote:
On Mon, 06 Sep 2004 00:00:53 +0200, Otto Jørgensen
otjoerge%øføø%@online.norway> wrote:
kan man ikke i grunnen si at problemet er at programmet ikke følger
anbefalingen til GEDCOM5.5 som jo anbefaler i hovedsak ANSEL uansett
om programmene i tillegg også kan handtere andre formater?
Problemet er at Linux ikke støtter hverken ANSI eller AnSEL.
tja, det er jo problem for dette systemet når de skal forholde seg til
GEDCOM5.5
Slik at problemet er jo i grunnen ikke avgivende system men at det for
det mottakende system er laget noe som handterer en vanlig GEDCOM-fil
--
Otto Jørgensen
http://home.online.no/~otjoerge/bk/
All email is checked by NORTON
Re: ANSI eller ANSEL?
Alf Christophersen wrote:
Hva er dette for tøv? Din vane tro foretrekker du å komme med sveipende
nedsettende uttalelser framfor å innrømme din egen inkompetanse. Jeg
hadde tenkt å holde meg unna no.fritid.slektsforsking.*, men jeg kan
ikke la slikt sludder bli stående uimotsagt.
For det første finnes det ikke noe ANSI-tegnsett definert i GEDCOM-
standarden. Godkjente tegnsett i GEDCOM 5.5 er ANSEL, UNICODE og ASCII
- sistnevnte er flat 7-bits ASCII uten støtte for diakritiske tegn.
Det tegnsettet som kalles for "ANSI" i GEDCOM-sammenheng, og som svært
mange slektsprogrammer de facto har lagt inn "støtte" for på egen hånd
(i praksis vil det jo si at de bare eksporterer og importerer default
Windows-tegnsett), er så godt som identisk med det som Microsoft kaller
"Western-1" og som ellers er kjent under navnene "Latin-1" og ikke
minst "ISO-8859-1" som også er en del av UNICODE-standarden. Kjært barn
har mange navn. ISO-8859-1 er forøvrig det tegnsettet de fleste i
Vest-Europa installerer som standard i Linux.
Det byr således ikke på noen verdens problemer å overføre dokumenter med
norsk tegnsett mellom Windows og Linux. For alle praktiske formål er
nemlig "Western-1" og "ISO-8859-1" identiske. (Det finnes forskjeller,
men det er i hovedsak i en lite benyttet del av tegnsettet som MS har
brukt til rammetegn.)
Merk også at GEDCOM 5.5-dokumentet anbefaler bruk av UNICODE (for å være
nøyaktig ISO 10646 som er temmelig lik dagens UTF-16), men da dette ble
skrevet fantes det knapt støtte for UNICODE noe sted. Siden begynnelsen
av 90-åra har det jo hendt mye på denne fronten, og det viser egentlig
bare hvor tragisk akterutseilt hele GEDCOM-"standarden" er, uten noen
sterk organisasjon bak seg til å vedlikeholde og videreutvikle den.
Idag er jo ikke UNICODE ett enkelt tegnsett med to bytes pr tegn, slik
det var definert fra starten, og som fortsatt lever som UTF-16. Snarere
har UNICODE utviklet seg til å bli et overordnet rammeverk hvor man
står relativt fritt til å benytte et hvilket som helst subsett så lenge
man har en entydig deklarasjon av dette i starten av dokumentet.
For det andre: Når det gjelder ANSEL, så har vel ikke Windows noe mer
støtte for det enn Linux har? Tegnsettet brukes idag knapt utenom i
GEDCOM, og det må således være opp til den enkelte applikasjon å
importere det på en hensiktsmessig måte. Tegnsettet er veldefinert, så
det skulle ikke by på problemer å konvertere automatisk for eksempel
fra ANSEL til en eller annen variant av UNICODE. Det aller enkleste i
så måte ville vel være å konvertere til UTF-8, som i likhet med ANSEL
bruker 2 bytes for å representere tegn over ASCII 127. Jeg ser at
Heiner Eichmann har flere konverteringstabeller mellom ANSEL og UTF-16
på denne sida:
<url: http://heiner-eichmann.de/gedcom/charset.htm>
Om PhpGedview har implementert en brukbar importrutine for ANSEL er en
helt annen sak. Dette har imidlertid ingenting med operativsystemet
Linux å gjøre, slik du synes å insinuere.
--
Leif Biberg Kristensen
http://solumslekt.org
Problemet er at Linux ikke støtter hverken ANSI eller AnSEL.
Hva er dette for tøv? Din vane tro foretrekker du å komme med sveipende
nedsettende uttalelser framfor å innrømme din egen inkompetanse. Jeg
hadde tenkt å holde meg unna no.fritid.slektsforsking.*, men jeg kan
ikke la slikt sludder bli stående uimotsagt.
For det første finnes det ikke noe ANSI-tegnsett definert i GEDCOM-
standarden. Godkjente tegnsett i GEDCOM 5.5 er ANSEL, UNICODE og ASCII
- sistnevnte er flat 7-bits ASCII uten støtte for diakritiske tegn.
Det tegnsettet som kalles for "ANSI" i GEDCOM-sammenheng, og som svært
mange slektsprogrammer de facto har lagt inn "støtte" for på egen hånd
(i praksis vil det jo si at de bare eksporterer og importerer default
Windows-tegnsett), er så godt som identisk med det som Microsoft kaller
"Western-1" og som ellers er kjent under navnene "Latin-1" og ikke
minst "ISO-8859-1" som også er en del av UNICODE-standarden. Kjært barn
har mange navn. ISO-8859-1 er forøvrig det tegnsettet de fleste i
Vest-Europa installerer som standard i Linux.
Det byr således ikke på noen verdens problemer å overføre dokumenter med
norsk tegnsett mellom Windows og Linux. For alle praktiske formål er
nemlig "Western-1" og "ISO-8859-1" identiske. (Det finnes forskjeller,
men det er i hovedsak i en lite benyttet del av tegnsettet som MS har
brukt til rammetegn.)
Merk også at GEDCOM 5.5-dokumentet anbefaler bruk av UNICODE (for å være
nøyaktig ISO 10646 som er temmelig lik dagens UTF-16), men da dette ble
skrevet fantes det knapt støtte for UNICODE noe sted. Siden begynnelsen
av 90-åra har det jo hendt mye på denne fronten, og det viser egentlig
bare hvor tragisk akterutseilt hele GEDCOM-"standarden" er, uten noen
sterk organisasjon bak seg til å vedlikeholde og videreutvikle den.
Idag er jo ikke UNICODE ett enkelt tegnsett med to bytes pr tegn, slik
det var definert fra starten, og som fortsatt lever som UTF-16. Snarere
har UNICODE utviklet seg til å bli et overordnet rammeverk hvor man
står relativt fritt til å benytte et hvilket som helst subsett så lenge
man har en entydig deklarasjon av dette i starten av dokumentet.
For det andre: Når det gjelder ANSEL, så har vel ikke Windows noe mer
støtte for det enn Linux har? Tegnsettet brukes idag knapt utenom i
GEDCOM, og det må således være opp til den enkelte applikasjon å
importere det på en hensiktsmessig måte. Tegnsettet er veldefinert, så
det skulle ikke by på problemer å konvertere automatisk for eksempel
fra ANSEL til en eller annen variant av UNICODE. Det aller enkleste i
så måte ville vel være å konvertere til UTF-8, som i likhet med ANSEL
bruker 2 bytes for å representere tegn over ASCII 127. Jeg ser at
Heiner Eichmann har flere konverteringstabeller mellom ANSEL og UTF-16
på denne sida:
<url: http://heiner-eichmann.de/gedcom/charset.htm>
Om PhpGedview har implementert en brukbar importrutine for ANSEL er en
helt annen sak. Dette har imidlertid ingenting med operativsystemet
Linux å gjøre, slik du synes å insinuere.
--
Leif Biberg Kristensen
http://solumslekt.org
Re: ANSI eller ANSEL?
On Mon, 06 Sep 2004 17:37:48 +0200, Alf Christophersen wrote:
*præhæhæ* Den var faktisk litt morsom.
Hvor i alle dager har du
det der fra?
--
Tore Aursand <[email protected]>
"Life is pleasant. Death is peaceful. It's the transition that's
troublesome." (Isaac Asimov)
kan man ikke i grunnen si at problemet er at programmet ikke følger
anbefalingen til GEDCOM5.5 som jo anbefaler i hovedsak ANSEL uansett om
programmene i tillegg også kan handtere andre formater?
Problemet er at Linux ikke støtter hverken ANSI eller AnSEL.
*præhæhæ* Den var faktisk litt morsom.

det der fra?
--
Tore Aursand <[email protected]>
"Life is pleasant. Death is peaceful. It's the transition that's
troublesome." (Isaac Asimov)
Re: ANSI eller ANSEL?
Leif B. Kristensen wrote:
Siden resten av meldingen var svært informativ, hadde det kanskje holdt
å si i en litt mer høflig form "Der tar du faktisk feil. Jeg skal forklare:"
mvh
Frank H. Johansen
Alf Christophersen wrote:
Problemet er at Linux ikke støtter hverken ANSI eller AnSEL.
Hva er dette for tøv? Din vane tro foretrekker du å komme med sveipende
nedsettende uttalelser framfor å innrømme din egen inkompetanse. Jeg
hadde tenkt å holde meg unna no.fritid.slektsforsking.*, men jeg kan
ikke la slikt sludder bli stående uimotsagt.
Siden resten av meldingen var svært informativ, hadde det kanskje holdt
å si i en litt mer høflig form "Der tar du faktisk feil. Jeg skal forklare:"
mvh
Frank H. Johansen
Re: ANSI eller ANSEL?
Frank Johansen wrote:
Som min salige gamle arbeidformann en gang sa:
Du skal ikke si at noen tar feil men du skal forklare hvorfor de tar
feil.
Magne Heen.
Leif B. Kristensen wrote:
Alf Christophersen wrote:
Problemet er at Linux ikke støtter hverken ANSI eller AnSEL.
Hva er dette for tøv? Din vane tro foretrekker du å komme med sveipende
nedsettende uttalelser framfor å innrømme din egen inkompetanse. Jeg
hadde tenkt å holde meg unna no.fritid.slektsforsking.*, men jeg kan
ikke la slikt sludder bli stående uimotsagt.
Siden resten av meldingen var svært informativ, hadde det kanskje holdt
å si i en litt mer høflig form "Der tar du faktisk feil. Jeg skal forklare:"
Som min salige gamle arbeidformann en gang sa:
Du skal ikke si at noen tar feil men du skal forklare hvorfor de tar
feil.
Magne Heen.
Re: ANSI eller ANSEL?
On Tue, 07 Sep 2004 21:35:47 +0200, in no.fritid.slektsforsking.it
Magne Heen <[email protected]> wrote:
samtidig tror jeg det står en anbefaling i reglene for news at man
også skal være varsom for hva man kritiserer andre for.
En ting er faktiske feil, noe annet er hvordan dette presenteres
--
Otto Jørgensen
http://home.online.no/~otjoerge/bk/
All email is checked by NORTON
Magne Heen <[email protected]> wrote:
Frank Johansen wrote:
Leif B. Kristensen wrote:
Alf Christophersen wrote:
Problemet er at Linux ikke støtter hverken ANSI eller AnSEL.
Hva er dette for tøv? Din vane tro foretrekker du å komme med sveipende
nedsettende uttalelser framfor å innrømme din egen inkompetanse. Jeg
hadde tenkt å holde meg unna no.fritid.slektsforsking.*, men jeg kan
ikke la slikt sludder bli stående uimotsagt.
Siden resten av meldingen var svært informativ, hadde det kanskje holdt
å si i en litt mer høflig form "Der tar du faktisk feil. Jeg skal forklare:"
Som min salige gamle arbeidformann en gang sa:
Du skal ikke si at noen tar feil men du skal forklare hvorfor de tar
feil.
samtidig tror jeg det står en anbefaling i reglene for news at man
også skal være varsom for hva man kritiserer andre for.
En ting er faktiske feil, noe annet er hvordan dette presenteres
--
Otto Jørgensen
http://home.online.no/~otjoerge/bk/
All email is checked by NORTON
Re: ANSI eller ANSEL?
On Fri, 3 Sep 2004 11:31:36 +0200, "Inger Eik"
<[email protected]> wrote:
Jeg ser at du har fått mange svar. Jeg har prøvd meg frem med alle 3
mulighetene for å kode i BK ved eksport, og fant ut at den eneste som
tok vare på de norske bokstavene I NAVN er ANSI (Windows). Problemet
er imidlertid at stedsnavn fortsatt har merkelige tegn der æøå skal
være. Når jeg så åpner gedcom fila i notepad, og lagrer med UTF-8, så
forsvinner alle norske tegn - både i navn og sted.
Hva er det jeg gjør feil? Noen som vet?
mvh Jan Vidar
http://www.janvidar.com/dyrevern
<[email protected]> wrote:
Jeg vet det har vært spurt om før, men jeg har glemt hvilket tegnsett man
skal bruke når man lager en GEDCOM-fil og vil ha med særnorske bokstaver.
Kan noen svare meg forholdsvis raskt?
Jeg ser at du har fått mange svar. Jeg har prøvd meg frem med alle 3
mulighetene for å kode i BK ved eksport, og fant ut at den eneste som
tok vare på de norske bokstavene I NAVN er ANSI (Windows). Problemet
er imidlertid at stedsnavn fortsatt har merkelige tegn der æøå skal
være. Når jeg så åpner gedcom fila i notepad, og lagrer med UTF-8, så
forsvinner alle norske tegn - både i navn og sted.
Hva er det jeg gjør feil? Noen som vet?
mvh Jan Vidar
http://www.janvidar.com/dyrevern
Re: ANSI eller ANSEL?
On Thu, 16 Sep 2004 13:19:07 +0200, in no.fritid.slektsforsking.it Jan
V.Pedersen <[email protected]> wrote:
når du leser en GEDCOMfile i en tekstbehandler vil bokstaver som ØÅÆ
være omformet i henhold til ANSI, ASCII og ANSEL.
Det er jo også klart at en slik omforming også vil omfatte æøå og det
er jo da naturlig at disse og alle andre ikke engelske karakterer blir
utformet i henhold til sitt regelverk
Du vil se samme opplevelsen med andre ikke engelske tegn og bokstaver
så det er ikke noe originalt eller feil at du ikke kan lese øæå i alle
formater
--
Otto Jørgensen
http://home.online.no/~otjoerge/bk/
All email is checked by NORTON
V.Pedersen <[email protected]> wrote:
On Fri, 3 Sep 2004 11:31:36 +0200, "Inger Eik"
[email protected]> wrote:
Jeg vet det har vært spurt om før, men jeg har glemt hvilket tegnsett man
skal bruke når man lager en GEDCOM-fil og vil ha med særnorske bokstaver.
Kan noen svare meg forholdsvis raskt?
Jeg ser at du har fått mange svar. Jeg har prøvd meg frem med alle 3
mulighetene for å kode i BK ved eksport, og fant ut at den eneste som
tok vare på de norske bokstavene I NAVN er ANSI (Windows). Problemet
er imidlertid at stedsnavn fortsatt har merkelige tegn der æøå skal
være. Når jeg så åpner gedcom fila i notepad, og lagrer med UTF-8, så
forsvinner alle norske tegn - både i navn og sted.
når du leser en GEDCOMfile i en tekstbehandler vil bokstaver som ØÅÆ
være omformet i henhold til ANSI, ASCII og ANSEL.
Det er jo også klart at en slik omforming også vil omfatte æøå og det
er jo da naturlig at disse og alle andre ikke engelske karakterer blir
utformet i henhold til sitt regelverk
Du vil se samme opplevelsen med andre ikke engelske tegn og bokstaver
så det er ikke noe originalt eller feil at du ikke kan lese øæå i alle
formater
--
Otto Jørgensen
http://home.online.no/~otjoerge/bk/
All email is checked by NORTON