[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [DX] DX-lehtiä annataan / digitointi
Terve Ilpo ja muutkin,
Kirjaskannerin Eurooppa-version info löytyy tarpeellisine tietoineen täältä:
http://diybookscanner.eu/home.html. Kauppaavat kahta mallia, kalliimman
kanssa tulee kaksi Canonin halvemman pään A810-kameraa tykötarpeineen.
Heijastamattomat lasit joutuu metsästämään itse. Olikin yllättävän lujan
takana löytää myyjä, mutta onnekkaasti sitten loppukesällä tärppäsi, kun
naapurissa Keravalla oli eräälle lasiliikkeelle jäänyt ylijäämäerä 6-7
vuoden takaa tällaista tyyppiä:
http://www.hy-tech-glass.ch/en/products/anti-reflective-glass/luxar/product-
information-luxar.html, mutta kuuleman mukaan " Schott Mirogard 3 or 4mm is
the best you can find at a decent price".
Itse rakennussarja oli tehty hyvin mitoilleen Latviassa, josta oli
toimituskin. Se vain, että kun olivat mokomat sitten maalanneet vanerit
mattamustiksi heijastusten pienentämiseksi, niin eivätpä olleet
toleransseissa enää ja käytännössä kaikki limittäin menevät osat joutui
hiomaan uudelleen maalittomiksi... Puuosat pystyisi teettämään itsekin,
zip-file osien mitoista löytyy ensimmäisen linkin alta. Tämä mainos on ollut
näytillä sivulla jo pian puoli vuotta: "COMING SOON: diybookscanner
standalone, no software configuration necessary", eli ei taida ihan pian
tulla... Täällä lisää EU-puuhamiehen (Linux-fani) ohjeistusta:
https://github.com/markvdb/diybookscanner/wiki. Vaikuttaa siltä, että
kehittäjien yleinen mielenkiinto on siirtymässä Spreads-ohjelmaan:
https://github.com/jbaiter/spreads/. Jos Ilpo ajelet Keski-Uudellamaalla,
niin ota yhteyttä; laite seisoo arkipäivät pitkät autotallissa käyttäjää
odottamassa... Kiinnostusta se on kyllä herättänyt. Jahka tosiaan saan zoom-
ja exposure -asetukset kohdalleen ilmeisimmin CHDK-skriptissä, niin ainakin
kameran muistikorteille asti alkavat kuvat sujuvasti päätyä. Teoreettinen
kuvausnopeus on 150-300 sivua tunnissa, mutta saas nähdä.
Niin, jos lasketaan 50 vuoden ajalle 10 lehteä per vuosi ja keskimäärin
vaikka 50 sivua, saadaan luku 25000. Ei ihan mahdoton määrä porukallakaan
tehtäväksi. Kysymys on lopulta siitä miten korkealle tai matalalle
"kunnianhimon rima" katsotaan sopivaksi asettaa. JKT:tä mukaillakseni,
toivottavasti emme ole tekemässä näitä vain itsellemme. Siksi täytyy
kiinnittää huomiota myös materiaalin yhtenäisyyteen ja arkistokelpoisuuteen.
Toki voidaan tehdä usean tason tallenteita eri käyttötarkoituksiin, sillä
mm. tiedostokoko määrittää pitkälle, miten nopeasti sivut verkon kautta
latautuvat. Nyky-RM:n perus-PDF-versiot ovat olleet n. 2-4 Mbyteä per lehti
"smallest file size" -asetuksilla. Arkistokelpoinen PDF/A on ainakin
tuplaten tämä. Kuvitteellisesti, kukapa tietää, vaikka joku 2100-luvun
avaruussään tutkija ei tämän käytännönläheisempää tietoa mistään muualtakaan
löydä n. vuosina 1920-2020 käytetystä AM-antiikkimodulaatiosta tai sitä
lyhytikäisemmäksi jääneestä FM-modulaatiosta ;-)
Koska kyse on tosiaan yli puolen vuosisadan lehtien tallentamisesta, niin
yritetään hakea parhaat menettelytavat hankkeeseen eikä ainakaan turhalla
hätäilyllä ajeta hommaa kiville...
Kaikenlaiset näkemykset asiasta ovat tervetulleita!
t. PRI
Date: Tue, 1 Oct 2013 10:12:12 +0300 (EEST)
From: "Ijl" <ijl@...i>
To: "Suomalaisten DX-lista" <dx@xxxxxxxxxxxxxxxx>
Subject: Re: [DX] DX-lehtiä annataan / digitointi
Mikä oli se firma ja minkä hintainen oli tuo lehtiskanneri (rak. sarja?)?
Itellä olisi käyttöä kun on sadoittain eli tuhansittain lehtiä jotka voisi
sakannata..
73,s IJL
Ei ole vaikeaa, mutta pirun iso työmäärä siinä on. Yli 50 vuodessa on
ehditty tuottaa tuhansia DX-lehden sivuja. Ennen offsetpainovaihetta
tehtyjen lehtien painojälki on aika surkea ja varsinkin OCR vaatii
melkoisesti aikaa sekä ihmisen silmää ja aivoja ohjelman tuottaman tekstin
korjailussa. Jos tyydytään pelkkiin alkuperäissivujen kopioihin (ilman
tekstin hakumahdollisuutta), työ on tietysti paljon pienempi.
Offset-lehdissä isoin homma on ilmeisesti juuri tuo tekstin ja
harmaasävykuvien yhteensovittaminen, josta Kari kertoo. Epäilen vahvasti,
että ainoa keino on jyrkentää skannattujen sivujen sävyjä jokseenkin
mustavalkoisiksi sen jälkeen kun sivulla olevat harmaasävykuvat on ensin
poistettu valinnasta. Tämä on aika helppo toimenpide sopivalla
kuvankäsittelyohjelmalla, mutta vaatii työtä. Millään toistokäyrän
manipuloinnilla se ei onnistu ilman, että tekstin selkeytys vaikuttaisi
myös
harmaasävykuviin.
___________________________________________________________________________________
DX mailing list
DX@xxxxxxxxxxxxxxxx
http://montreal.kotalampi.com/mailman/listinfo/dx
_______________________________________________
THE INFORMATION IN THIS ARTICLE IS FREE. It may be copied, distributed
and/or modified under the conditions set down in the Design Science License
published by Michael Stutz at http://www.gnu.org/licenses/dsl.html