Test af ny kilde - Danske Billeder
Kære Brøndbrugere
Så er der en ny kilde klar til test på testbrønden Nextkilde. Vi håber I har lyst til at være med til at teste den.
Der er tale om poster fra Danske Billeder, ca. 11.000 af slagsen. Posterne er lagt ind som DKABM-poster, så de er søgbare og visbare i grænsefladerne.
I kan læse om kilden her: http://oss.dbc.dk/wiki/bin/view/Databroend/DanskeBilleder
Der er ved at blive opbygget en wikiside om ekstern test af kilder, her kan I bl.a. læse om hvordan I får adgang til kilden: http://oss.dbc.dk/wiki/bin/view/Databroend/KilderTest
Der er et par specifikke emner, som I gerne må forholde jer til, netop i relation til Danske Billeder:
1. Titlerne på posterne kan være lettere spøjse. Billederne har ingen titler når vi modtager data, så vi har måttet konstruere titler ud fra billedbeskrivelserne.
Vi er klar over at det ikke altid fører til noget særligt meningsgivende, men håber I vil synes, at titlerne i de fleste tilfælde kan bruges.
2. Links til Danske billeder findes flere steder.
a. I selve DKABM-posten ligger en URL i dc:identifier. Denne peger på billedposten hos danskebilleder.dk
b. I relationen hasOnlineAccess findes en URL, der også peger på billedposten hos danskebilleder.dk
c. DKABM-posten har en hasImage-relation til et billedobjekt i brønden. Dette billedobjekt rummer en URL, der leder hen til en thumbnail-udgave af selve billedet, så det i grænsefladerne er muligt at vise billedet sammen med søgeresultater fra danskebilleder.dk
Alt efter hvordan jeres grænseflader er sat op, må I meget gerne teste hvordan disse links virker, da der i danskebilleder.dk's ende er nogle problemer med redirects, som kan drille i visse tilfælde. Test også gerne links via forskellige browsere.
Vi vil gerne have en tilbagemelding fra jer inden udgangen af marts måned.
mvh
Stine Weymann / DBC
Kommentarer
Første testtilbagemelding
Vejle har testet Danske Billeder og har følgende indspark:
Her er lige en første test herfra.
Fejl i URL’er:
I Explorer 8 er der fejl i poster, der refererer til kommunenavnene Hillerød, Ringkøbing-Skjern, Rødovre og Vallensbæk.
Det er sandsynligvis fejl, der kommer fra tegnene ø og æ i URL’erne (jf. for Hillerød: ’Hiller%C3%B8d’)
I Firefox, Chrome, Opera, Safari virker URL’erne udmærket.
Jeg har ikke testet i en nyere Explorer (da biblioteket kører XP J… men det gør ca. 30% af befolkningen så vist også)
Vedr. titler:
Posternes titler ser det i langt de fleste tilfælde rimelige ud.
Dvs. man må leve med de skønhedsfejl det giver, at forsyne billederne med titler på baggrund af beskrivelsen.
Der optræder eks. poster, der har overskrifter som ’1981’
(http://stg.vejlebib.dk/ting/object/150042%3AcatId12id898/query%3Adanske%20billeder%20%C3%A5rhus%3Bentry%3A10)
Hvilket skyldes indholdet i posten hos Danske Billeder:
Ejerlav:
Stabrand By
Personer:
Århus Lufthavn
Beskrivelse:
1981..
Emneord:
flyvemaskiner (62.95), flyvepladser (65.83)
Andet eksempel med overskriften ’Foto: P.’
(http://stg.vejlebib.dk/ting/object/150042%3AcatId12id2152/query%3Adanske%20billeder%20%C3%A5rhus%3Bentry%3A14)
Indholdet i posten hos Danske Billeder:
Ejerlav:
Koed By
Personer:
Thomas Peter Thomsen og hustru Mette Thommasen født Pedersen, Møgeltoftgaard, Koed
Beskrivelse:
. Foto: P.Hadtrup, Storetorv 9, Århus..
Man kan i øvrigt se de samme overskrifter i Europeana, hvor Det Kongelige Bibliotek ved eksport også har navngivet posterne ud fra feltet Beskrivelse.
Mht. manglende poster(?):
Jeg er undervejs tilfældigt stødt på nogle tilfælde, hvor jeg ikke kan se posterne via Brønden.
I det første tilfælde, er der tale om en søgning i Danske Billeder, Århus Kommune, på ’bibliotekspersonale’ hvilket giver et træf på 20 billeder - ingen af disse kan jeg søge frem i Brønden.
Men – det er så faktisk heller ikke umiddelbart muligt at søge ret mange billeder fra Århus frem i Brønden. Ved søgning på ordet ’Århus’ får jeg et træf på 22 billeder, mens jeg i Danske Billeder får et træf på 25.293 billeder.
Da testgrundlaget er på 11.000 billeder ud af over 72.000, er mit gæt selvfølgelig, at disse poster ikke er en del af testgrundlaget J
I det andet tilfælde, er der tale om ca. 400 poster, der befinder sig sidst i søgesættet hos Danske Billeder, hvis man vælger ’Ringkøbing-Skjern’ uden at specificere søgningen yderligere. Da alle disse poster udelukkende har et kommunenavn og ikke yderligere beskrivelse, er der sådan set heller ikke noget at sige til, at de ikke optræder i Brønden.
(Funktionaliteten af at have disse billeder i Danske Billeder må også siges at være ret begrænset J)
Eksempel:Information:
Kommunenavn:
Ringkøbing-Skjern
Adresse:
Årstal for billede:
Beskrivelse:
.
Filnavn:
4000543.tif
Med venlig hilsen
Jørgen Gram Christensen
Projektmedarbejder
DBC-respons på Vejle testresultat
- og her er hvad jeg har svaret Vejle:
Fejl i URL'er:
Umiddelbart tror ejg ikke der er så meget vi kan gøre, da det sandsynligvis er IE8, der har problemerne, og derfor aldrig vil komme til at acceptere URL'er af denne art. Men jeg tager den lige op internt med nogle af grænsefladetesterne, for at se om de har erfaringer i den retning.
Titler:
Det er dejligt at høre, at titlerne i de fleste tilfælde giver mening. vi håber brugerne ikke hæfter sig for meget ved de besynderlige af slagsen.
Manglende poster:
De er et godt bud, at ting der mangler, mangler pga. testsættets størrelse :).
Vi kan jo afprøve teorien, den dag vi har et helt sæt data fra Danske Billeder.
Til den tid vil vi umiddelbart også blive nødsaget til at slippe posterne fra Ringkøbing-SKjern igennem, om end de er meget begrænsede. Hvis vi får dem med fra Danske Billeder vil de trille med i Brønden, med mindre vi/I kan pege på nogle kriterier, der gør at en post skal frasorteres.
mvh
Stine
Jeg synes, at man skal være
Jeg synes, at man skal være meget varsom med at lægge dkabm-poster med yderst begrænset data ind i brønden, da disse poster ikke vil være andet end irriterende støj for brugerene. Hellere lidt og godt, end meget og skidt - hvis de skal tages i drift.
Så jeg finder det helt naturligt, at der skal findes en løsning til at sortere de 'irrelevante poster' fra, som Vejle nævner - og ikke bare "blive nødsaget til at slippe" de dårlige poster ind ;-). Det giver så selvfølgelig spørgsmålet: hvor stort (og godt) skal datagrundlaget være, før man vælger at sortere en dkam-post fra. Det har jeg ikke et stående bud på, men brugerne skal i al fald som minimum kunne få en lille forståelse af det billede, posten beskriver.
(Et afledt spørgsmål: hvordan foregår udvægelsen/oploadning af billeder til Danske Billeder generelt. Kan der være noget at hente ved at gå i dialog med de indvoldverede akiver og bibliotekers praksis for arbejdet med Danske Billeder, så datagrundlaget udvikles i en ønskværdig retning fremadrettet (jf. §2 i Danske Billeders vedtægter))
Alt dette sagt, vil det fx give mening at integrere kommunenavn eller sted som en slags undertitel? I nedenstående eksempel vil det i al fald give en fornemmelse af, hvad det drejer sig om allerede i listevisningen.
(http://stg.bibliotek.kk.dk/ting/search/1913-14#facets=facet.acSource:dan...)
Tilbagemelding fra Aarhus
Umiddelbart har vi flg. kommentarer til poster fra Danske Billeder i Brønden:
1. Det ville være super, hvis man med det samme kunne se, at her er der tale om billeder. Nu står der Netdokument.
2. Det virker lidt overflødig at titlen står der to gange, selv om det er meget lidt info, man får om det enkelte billede.
(vi vil gerne teste grundigere, men basen har desværre været nede de sidste to dage)
Mere feedback fra Aarhus
Vedr. emnefacet:
jeg synes det er forvirrende at der pludselig kommer dk5-decimalklassetal i emne-facetten, der ellers kun består af emneord:
http://stg.aakb.dk/ting/search/%22dilettantkomedier%22
eller
http://stg.aakb.dk/ting/search/gruppebilleder
Det tror jeg bliver svært at forstå for den almindelige bruger af hjemmesiden (hvis man da ellers vælger at slå kilden til )
Jeg er helt enig med Århus.
Jeg er helt enig med Århus. Hvorfra kommer til disse klassifikationer og emne ordfra (det ser lidt ud til, at der laves underlige koblinger fra dk5's alfabetiskse register). Eller anderledes formuleres: hvordan tildeler 'de' emneord i Danske Billeder?
Feedback fra København
Første en lille tilføjelse til tidligere kommentar (http://ting.dk/blog/test-af-ny-kilde-danske-billeder#comment-516). Måske kunne man sortere billeder uden beskrivelse - og derved titelgrundlag i nuværende model - fra.
Andre eksempel på sparsomt datagrundlag, hvor en kobling med geografi kunne gavne: http://stg.bibliotek.kk.dk/ting/search/danske%20billeder#facets=facet.ac...
Ikke "netdokument"
Enig med Århus: "Netdokument" er nok ikke relevant beskrivelse
geografiske emneord
Geografiske elementer som 'kommunavn' og 'sted' integreret som emneord er ønskeligt.
som addi-kilder
Det er oplagt at (gen)overveje, om der er potentiale i Danske Billeder som addi-kilder. Fx, så kunne http://stg.bibliotek.kk.dk/ting/object/150042%3AcatId8id1046/facets%3Afa... være relevant at knyttet til http://bibliotek.kk.dk/ting/object/710100%3A06486231/query%3Adanske%20kv...
beskrivelse ikke medtages hvis lig med titel
Vi synes ikke, at beskrivelsen skal medtages i posten, hvis den ikke er længere end dét, der bliver til titel
http://stg.bibliotek.kk.dk/ting/object/150042%3AcatId13id18/facets%3Afac...
for lange beskrivelser i visning
Kan der ikke sættes en begrænsning på længden af beskrivelsen, hvis der er meget lange.
http://stg.bibliotek.kk.dk/ting/object/150042%3AcatId12id508/facets%3Afa...
[tester videre senere :-)]
Svar fra DBC
Først vil jeg lige sige at det er virkeligt godt at få feedback fra jer.
Korte poster
Angående de meget korte poster som Jørgen, Vejle nævner, så tror jeg at vi faktisk har adresseret det problem.
I de testposter vi har taget udgangspunkt i var der rigtigt mange poster, som kun indeholdt et punktum og ikke andet i beskrivelse.
De havde derudover også kun meget sparsomt indhold i øvrigt, og vi valgte at opfatte dem som "slettede" poster, og disse bliver sorteret fra
nu.
Geografi
Angående mulighed for at indarbejde kommunenavn/sted i DKABM, så lyder det som et god idé.
Men vil I foretrække at det er som en undertitel, eller som et emneord. Jeg går ud fra at det ikke skal være begge dele?
Titel vs. Beskrivelse
Jeg synes det lyder som en god idé at udelade beskrivelsen, når den er så kort at den er dækket ind af titlen. Vi har i dag sat som
begrænsning at titlen ikke bliver længere end 90 karakterer. Vi kan blot sørge for, at hvis Beskrivelsen ikke var længere end 90
karakterer, så dannes dc:abstract ikke.
Type
Jeg er helt enig i, at det ikke er sigende at kalde det for et Netdokument. Jeg vil tage det op med den ansvarlige for DKABM formatet (Susanne Thorborg) om vi ikke kan udvide med en dc:type billede.
DK5 i facetbrowseren
Jeg er lidt i tvivl om hvorfor DK5 tallet er taget med i jeres facetbrowser i facet.subject indekset. Men det kan muligvis skyldes at vi ikke
har taget højde for det, når vi indekserer rene dkabm poster, at de kunne indeholde DK5. For jeg kan se at på almindelig marc poster, hvor
der tages højde for at det er en marc post, når der dannes indekser, der kommer DK5 tallene ikke med. Jeg undersøger nærmere.
For lange beskrivelser
Kan I sætte et antal karakterer på hvor lang en beskrivelse må være. Hvad giver mening i jeres grænseflader?
Visning af billede?
Jeg vil til gengæld høre om der er nogle af jer der har eksperimenteret med at få udleveret hasImage relationen og rent faktisk vise billedet
i grænsefladen?
Jeg ved at Vejle har kontaktet DBC angående at der var problemer med at få udleveret hasImage relationen, men det skulle vist være
løst nu (ret mig Stine W, hvis jeg tager fejl).
test af Danske Billeder
Vi har indtil flere gnage villet teste lidt merer på kilden, men indtil nu har det ikke været muligt. Kilden synes at være ganske ustabil. Den forsøger at åbne kilden op, men der sker ikke noget. Problemet synes at ligge hos Danske Billeder og ikke i Brønden. Hvis det er et generelt problem, synes vi ikke at kilden er særlig brugbar.