Monday, January 02, 2006

audiokirjoja: LiteralSystems.org

Löysin tuossa pari päivää sitten LiteralSystems.org -sivuston, jossa on ladattavissa paljon hyviä public domain'issa olevista teksteistä tehtyjä CC-lisensoituja audiokirjoja. Itse ihastuin kovasti Samuel Taylor Coleridge'n(1772-1834) runoihin. Erityisesti Kubla Khan tuli kuunneltua aika moneen kertaan, ja Rime of the Ancient Mariner myöskin ehkä pariin kertaan.

Mistään amatöörien puuhastelusta tässä ei ole kyse, vaan kirjoja lukee ammattitaitoiset henkilöt, joiden ääntä on ilo kuunnella. Projekti toimii osittain vapaaehtoisvoimin, ja osittain lahjoitusten avulla. 6-tuntisen audiokirjan tuottamiseen menee minimissä 4,712 dollaria, mutta tulos on vapaasti kaikkien kuunneltavissa. Mietiskelin tässä vähän, että voisin ehkä lahjoittaa jonkin kolminumeroisen summan, jos aikovat tuottaa audiokirjan jostain Lewis Carrolin teoksesta, esim. Hunting of the Snark.

http://literalsystems.org/abooks/doku.php?id=article:how_we_do_it
Currently a six hour long audiobook can be made by LiteralSystems for a minimum budget of $4,712.00 This is a high quality finished product that is in turn distributed freely on the web under a Creative Commons license and at no cost to the listeners. No royalties or licensing fees are collected except in the event of commercial re-broadcast.
...
No matter how slim and trim the process may be worked there is still the need for cash dollars to support making anything from a one hour to ten hour long audiobook recording. Complete dedication is an ideal that fails ultimately before an empty stomach, so we strive to pay decent living wages to those who keep it going.

Saman projektin tekijät ovat myös avanneet Creative Commons Choice Awards-sivuston, jonka avulla on tarkoitus palkita niitä artisteja, jotka julkaisevat teoksiaan vapaaseen levitykseen CC-lisenssillä.

An introduction to the Creative Commons Choice Awards. It's important for artists who release under Creative Commons to find recognition for their work. Praise is a good first step. Post your picks for the best in Creative Commons licensed media in arts and entertainment. Create a free account here and join us by making your suggestion for Artists and their work that you’d like to have considered in the running for the “Best of” awards.

Wednesday, December 21, 2005

Yhteiskunnallinen taloustiede

Skannailin tässä tänään/eilen taas yhden kirjan lisää. Walter Thomas Mills'in teos Yhteiskunnallinen taloustiede -- Erityiskurssi sosialismissa on painettu 1908 Hancockissa "Työmiehen kirjapainossa". Vallitsevana teemana ja näkökulmana on siis työväenliike/sosialismi, joka itselläni nostattaa historiallisista syistä hieman ennakkoluuloja, mutta ihan mielenkiintoista luettavaa tuo on joka tapauksessa.

Aikaisemmin olen tehnyt djvu-muotoisen kirjan lähinnä oletusasetuksilla, mutta nyt kikkailin vähän enemmän ja tein samalla korkearesoluutio-version, jonka kooksi tuli 19 megaa kun normaali versio oli 3.8. Normaali-versio on pääosin niitä varten, jotka haluavat lähinnä vain selailla tms., tai joilla ei ole laajakaistaa. Mutta jos haluaa oikeasti lukea tuon teoksen, niin kannattaa ladata se 19 megan paketti.. on sitä kuitenkin jonkin verran parempi lukea.

Yhteiskunnallinen taloustiede (djvu)
Yhteiskunnallinen taloustiede (korkearesoluutio-djvu)
http://www.archive.org/details/Yhteiskunnallinen_taloustiede


Lainaus teoksesta sivuilta 74-75:
Kun kaloja on runsaasti, elävat ihmiset hyvin, vie- 
läpa ylellisesti syöden. Kun heidan kalastusonnensa on
huono, joutuvat he puutteeseen, joka aiheuttaa kärsimyksiä
ja joskus muuttuu nälänhädäksi. Otaksukaamme nyt, että
yksi kalastajista haluten parantaa asemaansa ryhtyy kokoa-
maan kaloja varastoon.... Han kieltää itseltään nautin-
toja ja kokoo majaansa melkoisen määrän kuivattua kalaa.
Tamä on omaisuutta. Muuttuuko se pääomaksi tai ei, riip-
puu siitä, miten sitä käytetään. Jos sen tarkotuksena on
olla ainoastaan varastona kovia aikoja vastaan, pysyy se
omaisuutena, mutta ei tule pääomaksi.

Kalastajallamme voi kuitenkin kaloja varastoonsa koo-
tessaan olla suuremmatkin tarkotukset, kuin tasata vuosien
kalanautinnon. Kun huono aika lähestyy, kantaa hän kaiken
sen ruuan minkä voi vuorille, jossa hän löytää puita, joiden
kuoret voi helposti irrottaa terävillä kivillä. Kerran toisensa
jalkeen palaa hän vuorille työhönsä, samalla aikaa kuin hä-
nen naapurinsa ponnistelevat hengissä pysyäkseen. Huonon
ajan loputtua tuo hän rantaan kanoottinsa, niin keveän, että
hän voi sen kantaa hartioillaan ja niin kantavan, etta hän
voi sen kanssa meloa hietikoille parin kolmen peninkulman
päässä rannasta, jossa hän voi yhdessä päivässä pyydystää
yhtä paljon kaloja, kuin hän voisi saada rantakallioilla vii-
kossa.

Kanootti on pääomaa; kalastaja on nyt kapitalisti. Hän
saattaa nyt valita kolme asiaa. Hän voi kalastaa kanootil-
laan ja tuoda kotiin kaloja kylliksi voidakseen naida ja elät-
tää perheensä mukavuudessa sekä ylijäämälla palkata joita-
kin naapureistaan rakentamaan itselleen mökin, näiden naiset
kutomaan hänelle villavaippoja ja näiden lapset kantamaan
vettä lähteestä ja palvelemaan hänen perhettään; tai toiseksi
voi hän vuokrata kanoottinsa toiselle, joka mielellään ottaa
kanootin käytettäväkseen maksamalla siitä sen, minka yksi
perhe tarvitsee kaloja ja voi hän silloin elää taydellisessä jou-
tilaisuudessa, loikoillen päivänpaisteessa ja sateisina päivinä
oleksien mukavassa majassaan; tai voi hän kolmanneksi luul-
tavimmin vuokrata kanoottinsa ja itse käyttää hyvakseen tie-
toaan ja kokemuksiaan ...... rakentamalla kanootteja.
Yhä uudelleen saapuu hän rannikolle tuoden uusia kanoot-
teja, joiden käyttämisestä kymmenet hanen naapurinsa huu-
taen kilpailevat."

Tuesday, November 22, 2005

Tristan ja Isolde

Muutama viikko sitten divari-kierroksella löytyi taas mielenkiintoisia uusia (vanhoja) teoksia kuten Suuren hiljaisuuden miehiä ja Yhteiskunnallinen taloustiede. Ainoa, jonka olen ehtinyt skannaamaan ja kokoamaan tähän mennessä on Tristan ja Isolde -- Muinaiskelttiläinen tarina. Kirjan on suomentanut L. Onerva Joseph Bédier'n toimittamasta ranskankielisestä teoksesta. Se on nyt ladattavissa djvu-muodossa Internet Archive'sta:

Tristan_ja_Isolde.djvu
http://www.archive.org/details/Tristan_ja_Isolde
Tristanin ja Isolden romanttinen tarina sijoittuu ritari-ajan britanniaan, ja liittyy kuningas Arthurin legendaan mm. siltä osin, että Tristan oli yksi pyöreän pöydän ritareista. Kirjan ensimmäinen kappale toi itselleni ensimmäisen mieleen Romeon ja Julian:
Arvon herrat, suvaitsetteko kuulla kauniin
tarinan rakkaudesta ja kuolemasta? Se on
Tristanista ja Isolde-kuningattaresta. Kuul-
kaa siis, kuinka he suuressa riemussa ja suu-
ressa surussa rakastivat toinen toistaan ja
kuolivat samana paivana toinen toisensa
vuoksi.

Wikipedia-artikkeleita aiheeseen liittyen:
http://en.wikipedia.org/wiki/Isolde
http://en.wikipedia.org/wiki/Tristan

Wagner on myös säveltänyt tarinasta operan:
http://en.wikipedia.org/wiki/Tristan_und_Isolde

Tuesday, November 15, 2005

Open Library

Törmäsin juuri Internet Archiven sivuilla mielenkiintoiseen postaukseen:
http://www.archive.org/iathreads/post-view.php?id=45685
Tonight we launched our bookscanning initiative and presented a vision of an Open Library.

At the event, Microsoft Network (MSN) joined the Open Content Alliance and committed to kick off their support by funding the digitization of 150,000 books in 2006!

Itse en ole varsinaisesti mikään Microsoft-fani, mutta että ovat sitten rahoittamassa 150,000 tuhannen kirjan skannaamista.. tuo on kyllä hieno uutinen. Varsinkin kun ottaa huomioon, että Internet Archiven Million Books -projektissa on tällä hetkellä vain noin 10 000 teosta, ja Project Gutenbergissä noin 17 000. Olettaisin, että tuo on jonkinlainen vastaus Googlen aikeille skannata kaikki maailman kirjat (tai jotain siihen suuntaan). Muuta järjellistä selitystä en oikein keksi..

Katsastin äsken myös Open Library:n sivut. Siellä on luettavissa e-kirjoja erittäin paljon tavallisia (vanhanaikaisia) paperi-kirjoja muistuttavassa muodossa. Sivun käännöt on animoituja ja kaikkea.. Tuo on näemmä toteutettu jonkinlaisella (nykyään kovasti muodissa olevalla) AJAX-järjestelmällä.

Kokeilkaapa vaikka tuota teosta:
http://www.openlibrary.org/details/intlepisode00jamearch/leaf5

Osassa kirjoissa fontti-koko näyttää vähän pieneltä, ilmeisesti suurennus-ominaisuuskin on tulossa jossain vaiheessa..

Wednesday, November 09, 2005

Kalevalaseuran Vuosikirja 2

Skannalin tuossa aamulla taas yhden teoksen lisää:
http://www.archive.org/details/Kalevalaseuran_Vuosikirja_2_1922
Kalevalaseuran_Vuosikirja_2_1922.djvu

Kyseessä on Kalevalaseuran julkaisu vuodelta 1922. Artikkeleita ja kirjoittajia on lukuisia. Itselleni entuudestaan tuttuja nimiä oli mm. Akseli Gallen-Kallela, O. Manninen, Rafael Engelberg ja L. Wennervirta.

Tämä ei ole varsinaisesti vielä "lopullinen" versio. Tuota pitää vielä vähän hioa. Kuvien tarkkuutta voisi parantaa, ja sivut pitäisi rajata. Tällä hetkellä mulla vaan ei ole ohjelmaa, jolla tuon automaattisen rajauksen saisi helposti tehtyä. Pitää kai koodata joku pieni ImageMagickia hyödyntävä python-scripti.

Lainaus teoksesta sivulta 48 (kuva 47):
Vanha Vainamöinen eli, niinkuin häntä välistä kutsutaan Väinen, 
Väinemöinen, on Suomen kansan ensimäisina (päällä: eesmenneinä) aikoina
ollut aivan merkillinen mies seka viisautensa etta voimansa puolesta, niin
etta yksinkertaiset myöhempinä miespolvina pakanuuden aikoina häntä
pitivät Jumalana. Että hän oli väkeva, näkyy muutamista runoista; hänen
nimensa Väinen, Väinemöinen saattaisi olla väin sanasta johtunut (väki,
väin, väen) ja merkita väkevää. [Poispyyhitty. Yhdessa runossa sanotaan,
etta Väinämöinen oli vahva rautio eli seppä, hänen sanotaan myös tehneen
ensin kanteleen; "täyellinen, missä vaan miestä tarvittiin".] Ainoat tiedot
mitkä meidan aikaamme asti ovat Vainämöisestä muistossa pysyneet, löy-
tyvät niissä vanhoissa runoissa, [poispyyhitty: "jota yksinkertasille usein
lukevat kuoharit (päällä: runomiehet), että heitä piettäis tietajinä"] jotka en-
nen vanhuuen aikaan on ankarilta (päällä: suurilta) runoniekoilta tehyt
merkillisten asioien muistoks.
...
Se on uskottava, että niillä ajolla kuin Väinamöinen eli, oli Suomen
kansalla oma valtakunta ja Hallitus, ja Väinämöinen oli (korj.: saatto olla)
sen valtakunnan Haltian eli Ruhtina[a]n poika..

Tuesday, November 08, 2005

P.D. Ouspensky

Uusi skanneri tuli postissa maanantaina, ja testailin sitä vähän tuossa eilen. Automaattinen dokumentinsyöttö toimii ihan kivasti kun sivut on kohtuullisen paksuja ja hyväkuntosia. P.D. Ouspenskyn Tertium Organum tuli skannattua noin parissa tunnissa:

http://www.archive.org/details/Tertium_Organum
Tertium_Organum.djvu

Suomenkielisiä tekstejä, ja erityisesti Kalevala-aiheisia on tulossa luultavasti myöhemmin tällä viikolla. Kokeilin aiemmin skannata jotain "raittius-seuran" -runoja, mutta siinä oli pieniä ongelmia. Muutama sivu meni päällekkäin tai jotain.. täytyypä kokeilla uudestaan.

Monday, October 24, 2005

laite-hankintoja etc.

Edellisestä postauksesta on taas jo vähän aikaa, enkä ole lähiaikoina ehtinyt digitalisoimaan mitään uutta, mutta suunnitelmia jatkoksi on kuitenkin paljon.

Ajattelin hommata uuden skannerin, joka pystyisi skannaileen sivuja automaattisesti niin, että saisin uutta teksti-muotoista tavaraa nettiin mahdollisemman nopeaan tahtiin. Ehkä näin harraste-pohjallaki voisi päästä jopa vauhtiin 1 kirja per päivä. Ja se olisi tietysti kuva-muodossa(djvu) jonkinlaisen ocr-tuloksen kanssa. Laadukkaan teksti-muotoisen dokumentin tekeminen olisi paljon hankalampaa oikoluku- ja formatointi-prosesseineen, että siihen menisi helposti moninkertainen aika. Vaikka tietysti tärkeimmistä teoksista kannattaa tehdä myös teksti-muotoinen versio. Djvu-muotoon perustuva prosessi olisikin hyvä systeemi juuri siitä syystä, että sillä tavalla saisi laitettua nettiin myös vähän marginaalisempia vanhoja teoksia, jotka eivät muuten saisi nykyään juuri minkäänlaista yleisöä. Ja tietysti archive.org antaa tallennustilaa myös alkuperäisille skannatuille kuville, joten niitä voi käyttää apuna myös teksti-versiota tehdessä.

Tässä on vaan vielä kaikenlaisia ongelmia.. Jos kirjat skannaa automaattisesti, niin niistä täytyy poistaa selkäpuolen nide-systeemit (nidokset?), ja leikata sivut siisteiksi erillisiksi arkeiksi. Ja koska nide hajoaa tässä prosessissa, niin kirjaston kirjoja ei voisi käyttää hyväksi, vaan pitäisi lähinnä ostaa kaikki teokset divareista. Ja ennen vuotta 1923 painetut kirjat taas yleensä maksavat jotain 7 euron ja kolmen kympin välillä ehkä keskimäärin jotain 15 euron luokkaa. Ja vaikka vuoden aikana saisi luultavasti aika helposti digitalisoitua ainakin 100 kirjaa, niin niiden hommaamiseen (divareista) menisi jotain 1500 euroa, eli enemmän kuin mihin minulla on varaa..

Eli pitäisi joko jatkaa skannaamista hitaammalla "käännä sivua, paina enteriä, odota että skannautuu, käännä sivua.." -tyylillä tai sitten hommata jonkinlaista avustusta jostain..