Dmitry Baranovskiy har udviklet Optimus, et online værktøj hvor der kan udtrækkes en række af forskellige microformats fra en webside. Der kan vælges at få resultatet retur som en XML eller JSON fil.

Desværre understøtter Optimus værktøjet ikke fuldt ud UTF-8 tegnsættet endnu (kommer forhåbentlig). Så derfor vil danske æ,ø og å se lidt underlige ud i output til en XML eller JSON fil fra fx mit domæne. Der bliver interessant at se hvilke ideer og mashups der kan bygges videre på med output fra Optimus.
Nu vi snakker UTF-8 og at den såkaldte Top 99 danske blogs undersøgelse viste at ca. 74 % af disse kører WordPress under en eller anden form. Så læs Shevys kanon gode artikel “Hvis du bruger et andet tegnsæt end UTF-8” henvendt direkte til WordPress folket. Især passagen
Alt i alt kan jeg kun sige: Brug nu for fandengalemig og krafthelvede bare UTF-8!
Fra kommentarfeltet til ovennævte artikel nævner Karen Mardahl yderligere et godt læsetips om UTF-8 (Unicode mere præcis).
Mini FAQ om UTF-8 her fra
Q: UTF-8 lyder som noget nymodens, vil alle mine brugere af fx min blog kunne læse alle danske tegn?
A: Alle der har installeret en browser (uanset OS og model IE, NetScape, Opera, Firefox etc.) efter 1998 (det må vist være 99,9 % af alle på nettet) vil kunne læse UTF-8 tegnsættet, så ingen problemer med æ,ø og å
Optimus fundet via notizBlog





3 kommentarer
Spændende. Jeg har faktisk selv haft i tankerne at lave det samme som Optimus.
Det er jo nemt nok at lave microformats, men der er godt nok meget få værktøjer til at hive dem ud af siderne igen.
Dette ser lovende ud – her et eksempel på en anmeldelsesside på mitkbh:
http://microformatique.com/optimus/?uri=http%3A%2F%2Fwww.mitkbh.dk%2Ffloras-cafe
Sjovt nok, så lader det til, at æøå går fint igennem i anmeldelsesteksten, men ikke andre steder (fx overskrifter, tags osv.)
Men optimus ligner helt sikkert noget man kan arbejde videre på. Fedt!
XSL filer ligger klar på Optimus siden, så du kan begynde at arbejde videre til danske forhold
Ja det tegnsæt problem må de løse.
Jeg forstår at Michael Kaply ham med Operator plug in til FireFox arbejder på at lave et UserScript der kan træke microformats fra diverse websider ud i JSON er på vej. Men mere om det når det evt. sker
Yes, Optimus er lige hvad jeg har ventet på!
Jeg var ellers i gang med noget XSL selv, men det endte med at trække tænder ud.
2 Trackbacks
Nemt at lave mashups af mitkbh…
Som du måske ved, så er mitKBH syltet ind i microformats. Det er jo et genialt koncept, hvor vi bare sørger for at strukturere vores indhold på en måde, således det kan læses igen af en maskine – ligegyldigt hvordan vores design ellers er udfør…
[...] Pfefferle har leget lidt med Optimus værktøjet. Optimus er et onlineværktøj som trækker microformats ud af en webside og returner [...]