[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [DX] DX-lehtiä annataan / digitointi
Tervehdys,
Kyllä vaan, SDXL:n jäsenlehtien (1958-) digitointihanke on meneillään.
Valmisteluja on tehty pienellä porukalla nyt aluksi, että saadaan hiottua
perusprosessit kuntoon. Ensiksi on tarkoitus tuottaa pelkät näköis-PDF:t ja
toisessa vaiheessa - jos intoa ja innokkaita riittää -
tekstintunnistusohjelmalla (OCR) ajetut sanahakukelpoiset PDF:t. Lisäarvo
tästä jälkimmäisestä olisi melkoinen, mutta äärimmäisen työläs, sillä
tunnistustarkkuus ei aina ole 100%, vaan tekstit vaativat manuaalista
tarkistusta ja korjausta. Jos siihen vaiheeseen päästään, kaikki apu on
tervetullutta.
Selailtuani muutaman mapillisen 90-luvun enimmillään 60-sivuisia lehtiä,
tulin vahvasti siihen tulokseen, että jotain radikaalia helpotusta tarvitaan
skannausvaiheeseen. Tasoskanneri tuottaa laadukkaita kuvia, mutta käyttö on
hidasta ja puuha tarkkaa. Näinpä päädyin sellaiseen ratkaisuun, että hankin
omiin nimiini tämän alan harrastajien kehitystyön tuloksena syntyneen
härvelin eurooppalaisen version rakennussarjan:
http://www.diybookscanner.org/forum/viewtopic.php?f=14&t=1192. Sen toiminta
perustuu V-muotoisessa telineessä olevan avoimen lehtiaukeaman molemmista
sivuista yhtä aikaa otettaviin valokuviin 16 megapikselin kameralla, valon
tullessa ylhäältä. Käsikäyttöisen nostomekanismin avulla lähes
heijastamattomat lasitasot painavat kuvattavat sivut suoriksi ja
USB-pedaalin painalluksella laukaistaan kamerat (kuvissa vanha mekaaninen
käsilaukaisuviritys). Mekanismin yläasentoon palautuksen ja sivunkäännön
jälkeen voi ottaa kuvat seuraavasta aukeamasta. Tällä olen ajatellut kuvata
nyt itselläni olevat osin Ähtärin arkistosta noudetut vuosikerrat 1967-2010
(uudemmat jo PDF:inä). Mekaniikka on ollut kuukauden verran koossa ja nyt
yritän saada Canonin CHDK-skripteillä ja Ubuntulla ohjatut kamerat sekä
valaistuksen vireeseen. Windows-taustaisena siinäkin on hieman haastetta.
Lisäksi tulee vielä JPG-kuvien jälkikäsittely (esim. GIMP -Scan Tailor -
Acrobat), mutta sitäkin ketjua on mahdollista automatisoida.
Vanhimpia 50-60 -lukujen taitteen monistelehtiä on PS:llä jo valmiinakin,
mutta vielä odottelemme saittipalvelujemme tarjoajalta RKO:lta vahvistusta
levytilan riittävyydestä, indeksoitujen hakujen mahdollisuudesta ym.
käytännön asioista. Kaikki 1958-2013 lehdet lienevät (kertaalleen)
digitoituja ja luettavissa ensi vuoden kesäkokoukseen mennessä - hieman
riippuu miten palaset loksahtavat kohdilleen.
Koska usein kuultu kommentti on ollut, että jäsenmaksulle pitäisi saada
enemmän vastinetta - eikä valtionavun pienennys tässä suhteessa asiaa
ainakaan helpota - on lähtökohtana ollut, että DXClusiven tapaan lehtien
lukeminen olisi webmasterin antaman tunnuksen ja salasanan takana. Kyseessä
kun ovat kuitenkin nimenomaan jäsenlehdet. Mutta tästä saa olla eri
mieltäkin.
Apropos, tuo Ähtärin arkisto on toiminnassa (ks. RM 10/2008) ja sinne voi
toimittaa fyysisiä DX-kokoelmiaan harkinnan mukaan. Mutta ensin kannattaa
lukea tuo juttu ja ainakin olla SIH:iin yhteydessä.
t. PRI
----
Date: Mon, 30 Sep 2013 19:57:34 +0300
From: ilkka suni <...>
To: Suomalaisten DX-lista <dx@xxxxxxxxxxxxxxxx>
Subject: Re: [DX] DX-lehtiä annataan
At 19:31 30.9.2013, you wrote:
>Nuo olisi hyvä saattaa pdf muotoon ja vaikkapa laittaa jakoon tilaajien
>saataville.
>
>KTU
Minulla on se käsitys, että Liiton takavuosien julkaisujen digitointi
koordinoidusti on jo hyvässä vauhdissa. Asiasta oli postituslistalla puhetta
viimeksi... olikohan toukokuussa.
Taitaa Pasi eli PRI koordinoida hommaa, hän tiennee kertoa.
73, IS
___________________________________________________________________________________
DX mailing list
DX@xxxxxxxxxxxxxxxx
http://montreal.kotalampi.com/mailman/listinfo/dx
_______________________________________________
THE INFORMATION IN THIS ARTICLE IS FREE. It may be copied, distributed
and/or modified under the conditions set down in the Design Science License
published by Michael Stutz at http://www.gnu.org/licenses/dsl.html