Posts tonen met het label Taal. Alle posts tonen
Posts tonen met het label Taal. Alle posts tonen

22 oktober 2013

Lach de computer uit en ga verder: corrigeren via crowdsourcing


Het verwerken van historische plattegronden tot iets wat een computer kan begrijpen en een mens kan doorzoeken is een berg werk. Dit begint met het scannen van de kaarten en het daarna vectoriseren van de percelen. Veelal handwerk, dat vooral bestaat uit het digitaal overtekenen (overtrekken) van de originele perceeltjes op de kaart, zodat daar vervolgens allerlei specifieke informatie aan gehangen kan worden (eigenaren, gebeurtenissen, foto's enzovoort). Denk duizenden kadastrale kaarten en je bent al snel een paar miljoen percelen verder. Da's veel tekenwerk.

Bij de New York Public Library doen ze dat voortaan anders. Zij hebben Building Inspector:

The app uses digitized city atlases georeferenced by librarians and public volunteers on NYPL's Map Warper [waarover ik eerder al eens blogde], an online tool suite for creating interactive historical maps. These rectified maps are then passed through a new computer vision process devised by NYPL Labs called the Map Vectorizer, which recognizes building footprints and converts them into machine-readable shape files (think of it like OCR, but for maps).
This is a big leap forward in the work of digitizing old maps. Until now, feature extraction has been done manually by staff and volunteers, tracing each individual building footprint painstakingly by hand. This is a difficult task, usually requiring on-site training, and so it can take months or years to complete a single atlas. The Vectorizer, however, can crunch through an entire borough map in a matter of hours. The data's not perfect, but it's good enough to start figuring out easier, crowd-friendly tasks for validating and correcting it (like the yes/no/fix process at the center of this app). And all of that public input can then be used to refine and improve the Vectorizer process. Human-computer collaboration!

De app maakt duidelijk, dat hele complexe taken vaak bestaan uit een heleboel hele simpele taken. En eentje daarvan, daar kun je ze in New York bij helpen. Onder het motto "kill time, make history" (prachtig toch!) krijg je een kaart voor je neus met daarop een door de computer overgetekend perceel op de stadsplattegrond van New York. En drie knoppen: yes (als het perceel goed is herkend), no (als het niet om een perceel gaat) en fix (als iemand handmatig het werk van de computer moet corrigeren). Geen login of niks. Gewoon simpel. Gewoon even proberen dus. Of check eerst de tutorial.

Maar niet te precies hoor, "don't let perfect be the enemy of good." Laat dus niet iedere scheve pixel tot een fix leiden. En als de computer er een keer een echte mess van heeft gemaakt, dan "laugh at the poor computer and move on." Kijk trouwens vooral niet naar de voortgangskaart - een plattegrond van New York waarop je de door jou verwerkte percelen kunt zien - want dat is niet goed voor de motivatie...

Tot slot
Jaarlijks moet ik nog wel een paar keer mensen uitleggen waarom we op de website van het BHIC tutoyeren. Dat probleem hebben ze in het Engels al niet. En persoonlijk heb ik verder een groot een zwak voor de vaak lekker informele tone of voice die in veel Engelstalige crowdsourcingsprojecten en op websites wordt gehanteerd. Iets voor ons. Alsof het gewoon leuk is!

But enough yapping. Let's inspect some buildings!

Gerelateerd leesvoer
- Kaarten georefereren in New York
- Goed genoeg is ruim voldoende
- Kaarten maken, vergelijken delen met kaart.cc

14 december 2012

Test je Brabants met Brabble


Dialecten verdwijnen, regiolecten ontstaan. Het Brabants verdwijnt niet, maar ontwikkelt zich verder. Bovendien kun je nog altijd horen waar iemand vandaan komt; ik merk dat zelf ook, als ik bijvoorbeeld weer eens een praatje houd boven de grote rivieren.

In het nieuwste nummer van Brabant Magazine kun je Scrabble spelen op z'n Brabants: Brabble. Vorm Brabantse synoniemen van de opgegeven Nederlandse woorden, met alleen de letters op je plankje. En dat een beetje gauw, want anders is je tijd op.

Mijn tongval is aanwezig, het dialect blijkbaar weggesleten. Opvallend genoeg wist ik bij 'verbruien' al meteen dat het 'begaoie' moest wezen... maar voor het overige heb ik m'n score maar niet doorgetwitterd.

Dat kan wel - delen via Facebook ook trouwens - en de provincie hoopt zo meer jongeren aan te trekken. Misschien had een app dan beter geweest. Maar goed, maak er wat van. En lukt het niet? Dan kun je altijd nog bij de jongens van wijlen Draadstaal terecht voor een cursusje Brabants. Houdoe!


Foto: het officiële Brabantse leesplenkske

27 juni 2007

Dingen zullen nooit meer hetzelfde zijn (2) / Things will never be the same again (2)


For English translation, please see the blue text below

Zoals lang geleden beloofd, kom ik nog terug op de introductie van spraak in Second Life (SL). De vuurmuurproblemen zijn voorbij - ik kan weer gewoon praten - en inmiddels heb ik wat extra keren getest, met vrienden en met totale vreemden.

Via een speciale First Look Viewer kun je spraak nu ook al gebruiken op de main grid van SL. Daarvoor werkte het alleen op de speciale beta grid, de testomgeving. Niet iedereen gebruikt echter die First Look Viewer, niet alle plaatsen op de grid hebben spraak ingeschakeld en niet iedereen wil het sowieso gebruiken. Maar stapje voor stapje komt er wat meer stemgeluid op de grid.

Persoonlijk...
Er wordt heel wat afgepraat - meer gechat en gemaild trouwens - over de voor- en nadelen van spraak in ons tweede leven. Over het algemeen worden daarbij vooral gevolgen voor ieders persoonlijke leven in SL overdacht. Want ja, net als iedereen na een dagje hard werken in het echte leven toe is aan wat privétijd... zo ook houden de meeste poppetjes in SL er een meer of minder uitgebreid persoonlijk leven op na, naast hun werk.

Omdat het onderwerp van deze blog nu eenmaal niet het privéleven in SL is... zal ik me beperken tot de professionele kanten van mijn gedachten. Jammer hè! :-) Nou, verzin zelf maar... wat er allemaal kan gebeuren als je mensen met wie je vooral via chat een hechte band hebt opgebouwd, ineens aan een stem gekoppeld hoort. Geloof me... da's een aparte ervaring!

...en professioneel
Maar als archivaris, informatieprofessional, interesseren de professionele kanten me op dit moment even meer. En die zijn groot!

En iedereen ziet dat ook wel. Vooral presentaties of lessituaties zullen veel beter kunnen verlopen. Chat is qua snelheid toch beperkt. Je praat nu eenmaal sneller dan je typt. Dat is ook de reden dat al regelmatig bijvoorbeeld met VoIP wordt gewerkt... maar toch nog beperkt.

Desondanks worden er trouwens steeds meer lessen en colleges in SL georganiseerd. Van kleine klasjes tot inmiddels professioneel opgezette colleges, zoals laatst een serie over Virtual World Librarianship, georganiseerd door de University of Illinois. Met hier en daar de nodige opstartproblemen, die ieder nieuw initiatief nu eenmaal met zich meebrengt, laat dit toch zien wat in de (nabije!) toekomst gaat gebeuren: virtuele werelden in gebruik als educatief platform. Als een van de mogelijkheden dan.

Ik ben bijvoorbeeld benieuwd wat de Nederlandse initiatieven op dit vlak gaan brengen: Universiteit van Amsterdam, Vrije Universiteit, Amsterdam, Fontys Eindhoven...

Inlichtingenwerk
De inlichtingenmedewerkers - reference librarians - hebben het natuurlijk ook al veelvuldig over de introductie van spraak gehad. Dat zal het werk er niet makkelijker op maken! Via chat kun je bijvoorbeeld nog handig verschillende mensen tegelijkertijd helpen. Chat blijft in je schermpje beschikbaar en kun je dus teruglezen. Je kunt gesprekken van elkaar ook handig scheiden door instant messaging in te zetten of wat dan ook. En je kunt eerst je zin eens teruglezen voordat je op de verzendknop drukt...

Met spraak wordt het lastiger. Vooral als er tegelijkertijd ook getypt moet worden, omdat niet iedereen wil praten. Voor mezelf geldt - en ik denk voor alle personen die Engels niet als eerste taal hebben - dat ik me behoorlijk moet concentreren op het praten van anderen... en op m'n eigen gebabbel. Ik had het eerder al eens over accenten en zo? Nou, probeer dat met spraak... ;-)

Lastig dus... maar ook uitdagend! Toevallig dat ik afgelopen vrijdag een stagiaire had, uit de klas van hierboven (Virtual World Librarianship). In het dagelijks leven werkt zij in een medische bibliotheek en wat wil het toeval? Een vraag naar medische informatie! Bij mijn stagiaire was deze klant in goede handen... en achteraf merkte ze op dat ze graag spraak zou hebben kunnen gebruiken...

...wat mij deed denken dat het inderdaad een oplossing zou geven voor veel van de moeilijkere vragen die je krijgt tijdens je reference shift. Maar hoe hef je dan de nadelen op, die ik eerder opnoemde? Hmmm... Geen oplossing, maar wel wat ideetjes.

Misschien kun je in dergelijke gevallen een specialist oproepen (via een instant message aan de groep van reference librarians bijvoorbeeld), waarna iemand speciaal voor die klant - eventueel in een andere ruimte in verband met privacy, zoals bij zo'n medisch gerelateerde vraag - door middel van spraak de klant letterlijk te woord staat. Zou zomaar kunnen.

Oh ja... nog een ander probleem: wat te doen met alle personen die niet zo denderend Engels kunnen spreken? Voor het vertalen hebben we nu nog de beschikking over Babbler, een vertaalmachine. Dat ding is niet perfect, maar voldoet voor bepaalde doeleinden best goed. Op die manier kan ik al Spanjaarden, Portugezen, Fransen enzovoort helpen... als de vragen niet héél ingewikkeld worden natuurlijk. Met spraak kan ik dat wel op m'n buik schrijven hoor! Misschien iets voor taalspecialisten dan...?

En wat nu?
Tja, je zult begrijpen dat alle proble... euh... uitdagingen nog niet tot oplossing zijn vervormd. Spraak is nog niet eens definitief beschikbaar hè! Er wordt echter volop over nagedacht. Maar dat sommige dingen nooit meer hetzelfde zullen zijn, dat staat wel vast... op alle vlakken... ;-)

ENGLISH TRANSLATION

Like I promised a long, long time ago, I'll now tell you something more about the introduction of voice in Second Life (SL). My firewall problems are history - I can talk as usual - and by now I've tested a couple of times more, with friends and with total strangers.

With a special First Look Viewer you can now use voice on the main grid of SL. Previously it only worked on a special beta grid, a test environment. Not everyone uses the First Look Viewer though, not all sims on the grid have voice enabled and for sure not everyone will use voice anyway. But step by step the sound of voices will be heard more and more on the grid.

Personal...
There has been lots of talk - more like chatting and mailing, by the way - about the pro's and con's regarding voice in our second life. On the whole, especially the consequences for everyone's personal lives are thought about. Because yes, just as you're in need for some private time when you come home after a long hard day of work in real life... like that also many of the digital characters in SL have a more or less private life, next to their work.

Because the subject of this blog isn't that private life in SL... I'll restrict myself to the professional sides of my thoughts about voice. Too bad huh?! :-) Well, you just figure out for yourselves... what could happen if you get people connected to a voice all of a sudden, who you have build a close bond only through chat. Trust me... that's a strange experience!

...and professional
But as an archivist, information professional, the professional sides of all this do interest me a little bit more at this point still. And these sides are huge!

And everybody recognises that, so it seems to me. Especially presentations and classes could become better using voice. Chat is still limited regarding speed. You can just talk faster than you can type anyway. This is the reason that for example VoIP is used... but on a small scale still.

But nonetheless more and more classes are held in SL. From little instructions to professional classes, as lately a series about Virtual World Librarianship, organised by the University of Illinois. With here and there some setup problems, as seen with every new initiative, of course, these classes show what will probably happen in the (near!) future: virtual worlds used as an educational platform. As one of the possibilities, that is.

For example I am very curious as to what the Dutch initiatives are up to concerning this: University of Amsterdam, VU University, Amsterdam, Fontys Eindhoven...

Reference
The reference staff have talked much about the introduction of voice on the grid. For sure it won't make working there easier! For example, with chat you'll be able to help several people at the same time. Chat remains visible in your history window, so you'll be able to read it back. You can even separate different conversations by using instant messaging channels. And you can read a line twice before hitting the send button...

With voice this will become hard. Especially when you have to type at the same time still, because not everyone is willing to talk. I - and I guess many other people that don't have English as their native language - also have to focus big time on the words that others are saying with voice... and on my own babbling. I've talked about accents and dialects before? Well, try that using voice... ;-)

Hard... but also challenging! Coincidentally, the other day I had someone shadowing me at the reference desk when I was on duty, from the class I mentioned above (Virtual World Librarianship). In daily life she works in a medical library and you know what? A question for medical information! Well, this customer was in good hands with my shadow... and after that she mentioned to me the fact that she would have liked to use voice then...

...which made me think about the fact that this maybe could be the possible solution for many hard questions, which you'll receive during your reference shift. But how do you deal with the disadvantages then? Hmmm... No sollution, but some idea's still.

Maybe in such cases you can call in a specialist (with an instant message to the group for reference librarians, for example), then someone, especially for this customer, will come and actually talk to this person - maybe in a private area, like with questions about medical issues (or voice would have to be enabled in instant message mode too). Could be.

Oh yes... another problem: what to do with all of the people that can't speak English that well? For translating, we have the Babbler still now, a translation device. That thing is far from perfect, but works fairly well most of the time, for specific needs. Like that, I've been able to talk to Spanish people, Portuguese people, Frenchmen etc... when questions aren't really hard, that is. With voice, I can't help any of those people, of course! Maybe call in the language specialists then...?

And now what?
Well, as you'll probably can imagine, not all proble... eh... challenges have been changed into solutions by now. Voice isn't even available to everyone yet! We're thinking about it a lot though. But that some things will never be the same again, that is just a fact... on all levels... ;-)

16 juni 2007

Dunglish / Dunglish


For English translation, please see the blue text below

Maarten Rijkens werd geboren in Nederland, maar werkte de meeste jaren van zijn leven in het buitenland voor grote multinationals. Hij heeft zich in al die tijd sterk verbaasd over het Engels van de Nederlanders. Bijvoorbeeld over hoe schaamteloos de Nederlander met zijn vakantie-Engels belangrijke, zakelijke onderhandelingen ingaat.

Het soms gekunstelde Engels van de Nederlanders, meestal letterlijke vertalingen naar het Engels van het Nederlands zelf, noemt Maarten als taal het Denglish (Dutch-English). In zijn boekje I always get my sin heeft hij een bloemlezing gegeven van al het fraais dat hem ter ore kwam tijdens zijn loopbaan.

Overigens kom ik Denglish op het internet vrijwel altijd tegen in relatie tot het Duits. Voor Nederlands-Engels wordt dan de term Dunglish gebruikt. Klik naar deze blog voor fraaie voorbeeldjes daarvan. (Zelf heb ik het altijd over boerenkool-Engels, overigens.)

Een collega van mij, die jarenlang in Engeland woonde en met wie ik het over mijn taalervaringen in Second Life (SL) had, nam het boekje van Maarten voor me mee. Zelf had ik het wel eens bij de boekhandel zien liggen, maar nooit verder gekeken dan m'n neus lang was. (En hoe zal ik dat nu eens vertalen straks... :-))

Dunglish in Second Life
Ach, een onderhoudend boekje wel. En ik geloof best dat al die zinnen echt door Nederlanders zijn gezegd. Ook al waren het dan dure zakenmannetjes die praatten over het kopen van aandelen of het verkopen van bedrijven. Maar zo letterlijk en slecht als de meeste zinnen in dat boekje? Nee, dan doet deze archivaris het toch wel veel beter... in alle bescheidenheid overigens... :-)

Toch herken ik wel wat. Zo vertaal ik al pratende in SL ook regelmatig Nederlandse uitdrukkingen en gezegdes letterlijk naar het Engels, die dan niet direct worden begrepen... Of ik weet een woord niet en laat dan het Nederlandse woord maar gewoon op het Engels lijken door wat letters te veranderen of toe te voegen... hopende dat het klopt... of in ieder geval begrepen wordt. (En euh... meestal is dat niet zo!)

Trouwens, ik heb ook heel wat poppetjes ontmoet die erg gecharmeerd waren van het Nederlands en haar gezegdes. Het is dus niet allemaal verkeerd, dat letterlijke Nederlands-Engels. De topper is nog steeds doe maar gewoon, dan doe je al gek genoeg en als woord houdoe. Veel bewoners van SL vinden het gewoon leuk om in verschillende talen te kunnen groeten en gedag zeggen. Nou ja, dan ben ik als Brabander ook niet te beroerd natuurlijk...

Taalverwarring in Second Life
Los van dit grappige gepruttel met woorden, zinnen en gezegdes, is er wel degelijk iets serieus te zeggen over taal en taalproblemen in SL. Het feit dat niet alle poppetjes even goed Engels spreken - en een heleboel zelfs niet - maakt bijvoorbeeld dat het internationale karakter van deze nieuwe wereld wel eens geweld wordt gedaan. En da's jammer, want het is een van de grootste pluspunten van SL. (Tijdzones helpen trouwens ook niet echt mee!)

Zoals gezegd, red ik me zelf best wel. Het boekje van Maarten wordt voor mij dan ook pas echt interessant als je bij de laatste paar bladjes bent aanbeland. Daar wordt ingegaan op het feit dat op zich correcte woorden en zinnen desondanks verschillend worden geïnterpreteerd door Nederlanders en Engelstaligen. Een soort cultuurverschil misschien? In ieder geval een bron van veel verwarring... misverstanden zelfs! Geloof me...

Zo schijnt voor Engelsen - ik zal het eens navragen bij ze - de kreet interesting de grootste dooddoener te zijn die er is. Het wil voor een Engelsman zoveel zeggen als: Dat nooit! We will look into it is gewoon een beleefde manier om te zeggen dat ze het wel kunnen vergeten, terwijl not bad iets zegt als that's good, very good! Ja, dan wordt het lastig hè?

Als ik naga hoe vaak ik dingen al interesting heb genoemd... Nou, al die Engelsen zullen wel denken van me... :-(

Trouwens, omgekeerd werkt het ook hoor! Als een Engelsman zegt very interesting bedoelt hij dus iets als I do not agree at all, maar Nederlanders denken: He is impressed! Nou jij weer... Maar goed, allemaal volgens Maarten dan.

Taalfactor van belang
Ook voor het dienstverlenende werk in SL is die taalproblematiek van belang. Het goed begrijpen van elkaar maakt of de klant tevreden (digitaal) huiswaarts gaat of niet. Alleen nu zit je ook nog eens met die taaltoestand. En dat is in het echte leven nu eenmaal een stuk minder.

Gelukkig komt er steeds meer aandacht voor de internationale karaktertrek van SL, met alle bijkomende problemen... euh... uitdagingen van dien. Taal is daarvan een belangrijk onderdeel.

Ook leuk...
Tenslotte, ik weet natuurlijk weinig van het Engels, maar kom niet alleen met Engelsen in aanraking... Ook Amerikanen, Canadezen en wat dan ook spreek ik regelmatig (en dat weer in verschillende dialecten). En die spreken allemaal een wat ander Engels. Of een wat veel anders Engels. En van iedereen pik ik wat spreektaal op. Want al is chatten nog zo schriftelijk... Het blijft spreektaal.

Links en rechts krijg ik dan ook regelmatig te horen dat ik van dat irritante UK English heb aangeleerd gekregen... of van die verschrikkelijke woorden uit het US English heb overgenomen!

Ja, kan ik het helpen? Ik ken alleen maar het Dunglish... :-)

ENGLISH TRANSLATION

Maarten Rijkens was born in the Netherlands, but worked abroad most of his life, for big multinationals. All that time he has been amazed with the English language the Dutch spoke. For example how shamelessly the Dutch start negotiating business on important things with some holiday-English only.

This sometimes even pidgin English, most of the times just literal translations from Dutch to English, is called Denglish (Dutch-English) by Maarten. In his little book I always get my sin (a literal translation from Dutch for I always get what I want) he gives an overview of some funny things he has heard over the years during his career.

Anyway, on the internet I see Denglish almost anytime related to German (Deutsch) only. For Dutch-English the word Dunglish is used. Click to this blog for some nice examples on that. (I for myself always talk about farmer-cabbage-English, by the way.)

A colleague of mine, who lived many years in England and with whom I spoke about my language experiences in Second Life (SL), gave me Maartens' book. I had seen it once or twice at the book store, just never looked any further than my nose was long. (I wonder how that saying translates now... :-))

Dunglish in Second Life
Ah well, an entertaining little book, that is. And I really believe all of those sentences have been said by a Dutchman once. Although maybe they even were some fancy business people in suits, talking about buying stock exchange or selling companies. But as literal and bad as most of the sentences in the book? No, I'm sure this archivist is doing way better than that... still wanting to be modest though... :-)

But I happen to recognise some things still. Also for myself, while talking in SL, I translate many Dutch sayings and figures of speech literally to English, that are most often not understood right away... Or I don't know about a word and then just let the Dutch word look like an English one by changing some characters in it... hoping it will be correct... or at least that it will be understood. (And euh... most of the times it is not!)

Anyway, I have met many avatars that were very charmed with my Dutch and its sayings. So it's not all wrong, the literal Dutch-English. The favourite out there still is just act normal, that will be crazy enough and as a word houdoe (North Brabant dialect for goodbye). Many residents of SL just like it to say hey and goodbye in different languages. And well, as someone from North Brabant I am of course willing to let them know about it...

Language confusion in Second Life
Besides this fun with words, sentences and sayings, one can most definitely say something serious about language and language problems in SL. The simple fact that not all avatars talk English that well - and some don't speak it at all - makes the international character of this world somewhat less strong. And that is too bad, because this should really be one of the added values of SL. (Time zones don't really help either, by the way!)

Like I said, I'll be fine. The book by Maarten becomes most interesting for me when one arrives at some of the last pages. That's where he mentions that sometimes the right words and grammar are still differently interpreted by the Dutch and the English. Maybe some sort of cultural difference? At least a source of much confusion... misunderstandings even! Trust me...

So it seems that for the English - I'll ask them about it - the word interesting is the biggest silencer there is. For an Englishman it means as much as: Never that! We will look into it happens to be just a polite way of saying that they can forget about it, while not bad says something like that's good, very good! Well, things can get tricky then, huh?

If I think about all the times I've called something interesting already... Well, what would all those English people think about me now... :-(

By the way, this also works the other way around! When an Englishman says very interesting he means something like I do not agree at all, but the Dutchman thinks: He is impressed! Well, there you go again... Anyway, all according to Maarten, that is.

The importance of language
Also for customer services in SL the language problems are important. Good understanding of each other makes or breaks the fact that a customer (digitally) goes home happy or not. You just have to deal with the langage thing too now. And in real life that's just a whole lot less.

Fortunately there is more and more attention for the international characteristic of SL, with all the upcoming problems... euh... challenges that come with that. Language is a main issue in it.

Also fun...
To close this, I don't know much about the English really, but do not only meet Englishmen, of course... Also I speak quite regularly with Americans, Canadians and such (and in different dialects, that is). And they all speak a somewhat different version of English. Or a whole lot different version of it. And I learn some spoken language from all of them. Because although chatting is as much writing as it is... it still remains a spoken language.

So from the left and the right I get to hear quite often that I've learned such annoying UK Unglish... or that I've used such terrible US English words!

Well, I cant't help that, can I? All I know is Dunglish... :-)