Quantcast
Channel: Mårten Seiplax – Utvecklingsbloggen
Viewing all articles
Browse latest Browse all 12

George Bush eller George Bush ?

$
0
0

Då du skriver George Bush i en text är det omöjligt att veta vem det handlar om, såvida det inte också nämns t.ex. att han var president under år X-Y.

Det som vi nu infört på svenska.yle.fi är termer för personer, företag, organisationer och händelser. De tillhandahålls av Freebase (ägs av Google) och gör det möjligt att i en text säga vilken George Bush det handlar om. I många fall finns det till och med en bild på personen så man behöver inte komma ihåg vilken av dem som hade vilket mellannamn.

Orsaken det är viktigt att sätta in vilken person det handlar om är att vi kan göra ”same as”-länkar. Det gör att vi kan visa alla artiklar om George Bush den yngre i en lista, och allt om den äldre i en annan. För Yle i detta skede finns det redan ett värde i att sökmotorerna vet att artikeln handlar om personen som ”definieras/förklaras” i Freebase. Det i sig är en ”same as” -länk. Det är bra ur hittbarhetssynvikel i sökmotorerna. Om tidningshusen någon gång i framtiden skriver om samma person och gör kopplingen till Freebase förstår olika system att det handlar om samma person.

Vem finns då i Freebase?

Det som finns på Wikipedia finns i princip också på Freebase. Det finns vissa brister i vilka roller som en person har. Även om det är en känd person i Finland, t.ex. en politiker i våra ögon, så känner Freebase inte till det. Istället står den minsta gemensamma nämnaren – kvinna eller man. Freebase använder sig av termerna hondjur och handdjur. Ju mer Freebase används desto snabbar blir datan mer komplett.

Ute i regionerna så kommer det att finnas många personer, företag, organisationer och evenemang som inte finns i Freebase. Om du märker någon som saknas kan du rapportera om den via SYND så försöker vi infoga det i Freebase och utarbeta ett framtida arbetsflöde för nya termer. I detta skede är det relevant att sätta till personer som det finns skäl att tro att vi kommer att skriva många artiklar om, t.ex. en kommundirektör. En person som det inte finns skäl att tro att det skrivs många artiklar om behöver inte kopplas till Freebase.

Freebase och Onki

En exempel artikel med två Freebase termer är Norges kronprins på besök i Helsingfors. Den ena är en ”same-as” länk till Haakon, Crown Prince of Norway och den andra till Helsinki

Språket i vår Freebase modul blir automatisk svenska om det finns en sådan version. Om den inte finns kan man även använda andra språk. Det är bäst att använda den svenska versionen.

Så vilka termer skall man då sätta med i en artikel?

Den som bäst kan svara på det är författaren. I ovanstående fall har vi inom metadata gruppen en delad uppfattning huruvida Helsingfors är viktigt eller inte. Den ena tolkningen är att man vill hitta att Prins Haakon varit i Helsingfors då man söker info om Helsingfors, den andra är att det inte är relevant i detta fall. Det finns inga klara regler att ge, utan man måste bedöma från fall till fall, och enligt eget huvud.

Freebase är ett komplement till ONKI termerna som används för att beskriva världen med en strukturerad ontologi. I exempel artikeln t.ex. ”Statsbesök”.


Viewing all articles
Browse latest Browse all 12