Ako archivovat

ivan

Ako archivovat
« kdy: 07. 09. 2013, 20:05:58 »
Zaujima ma vas pohlad a nazor na archivaciu konkretnych typov dat.
Zaoberam sa problemom ako zachovat citatelnost ulozenej informacie.
Konkretnejsie:
1. dokumenty, spreadsheety (asi export do RTF, TXT, CSV)
2. fotky (aky format)?
3. videa (aky format)?
4. source code (nie je problem lebo ide vacsinou o plain text)
5. proprietarne formaty (ak je mozne, tak export do plain textu: TXT, CSV)

V pripade proprietarnych formatov by som asi pribalil aj aplikaciu, v ktorej bol dany subor vytvoreny.
Ak by islo o open-source, tak by som uvazoval aj napaleni source code.
Minimalna dlzka archivacie tak cca 70 rokov, fotky a videa aj dlhsie.
Odporucane postupy a technologie by mali dostupne pre domacnost - kamenne dosky nemienim vyuzivat  :)


libcha

Re:Ako archivovat
« Odpověď #1 kdy: 07. 09. 2013, 20:27:28 »
Já bych se přidal se svým podobným požadavkem :)

Chtěl bych nějak zazálohoval své maily z freemailových služeb (seznam, gmail), tak aby ideálně je bylo možné v případě jejich smazání na serveru je tam IMAP nacpat zpátky. Hlavně ale aby je bylo možné ještě alespoň 10-20 let číst.
- jakým programem ? (pravděpodobně mailový klient jako thunderbird)
- do jakého formátu ? (milion .eml souborů či něco jiného)

Už jsem s tím dělal pokusy: thunderbird pro windows portable. Stáhnul si všechny maily do sebe úspěšně, byly uloženy v nějakém jeho custom inboxu co uměl číst jen on, ale šlo je vyexportovat do eml souborů. Když jsem je na serveru smazal a pak chtěl nahrát zpět, teoreticky to šlo spustit, ale server (seznam.cz) nepobral tolik požadavků na nahrání emailu najednou a zarazil to.

Napadá mě: to ještě nikdo podobný požadavek neměl, abych utfg našel milion howtoček ?

#

Re:Ako archivovat
« Odpověď #2 kdy: 07. 09. 2013, 22:07:29 »
Predstava, ze ti k necemu bude za 70let aplikace, v ktere si puvodni data vytvoril je mirne receno usmevna ... ledaze bys tam teda aspon pridal i obraz OS pro teoreticke pouziti v simulatoru, lec tezko rict co bude za tak dlouhou dobu :)

Jinak, pro archivaci dokumentu bych osobne pouzil jako jednu z metod papir, mozna to neni kdovijak prevratna metoda, ale na 70 let a radove nasobky teto doby ji za nas otestovali jini ... fotky bych archivoval zrejme osvitem na nakou folii nebo chemickou cestou na papir (baryt!), tu dat pozor na danou technologii a neverit zblebtum o inku co zmakne 100 let, neni vyzkouseno, v kazdym pripade skladovat v temnu a suchu

Pro videa se obavam, ze moc moznosti neni, resp prepis na celuloid asi nic moc, takze zrejme v nativni podobe a dej si tam k tomu obrazu OS i naky kodeky ;p

Jinak napr http://ronja.twibright.com/optar/ pro ucelnejsi vyuziti dat na papire ... adios

JardaP .

  • *****
  • 11 064
    • Zobrazit profil
    • E-mail
Re:Ako archivovat
« Odpověď #3 kdy: 07. 09. 2013, 22:41:24 »
Jinak, pro archivaci dokumentu bych osobne pouzil jako jednu z metod papir, mozna to neni kdovijak prevratna metoda, ale na 70 let a radove nasobky teto doby ji za nas otestovali jini ...

Jo, ale cim to vytisknout? Pred casem ty nekdo rikal, ze se mu oloupala pismenka ze starych vytisku z laserovky nebo z kopii z Xeroxu, coz vyjde na stejno. To leda tak, ze by kazdou stranku prestrikal lakem.

Ramtech

Re:Ako archivovat
« Odpověď #4 kdy: 08. 09. 2013, 00:34:39 »
http://www.ollydbg.de/Paperbak/index.html#4

V prípade diskov by som šiel do Data Tresor Disc

A čo sa týka proprietáreho SW ani by som sa nenamáhal za 70 rokov nemusí byť po OS na ktorom by ten SW šiel nainštalovať ani vidu ani slychu zatiaľčo zdrojáky ti dávajú aspoň možnosť


Re:Ako archivovat
« Odpověď #5 kdy: 08. 09. 2013, 07:40:51 »
Zaujima ma vas pohlad a nazor na archivaciu konkretnych typov dat.
Zaoberam sa problemom ako zachovat citatelnost ulozenej informacie.
[...]
Minimalna dlzka archivacie tak cca 70 rokov, fotky a videa aj dlhsie.
Odporucane postupy a technologie by mali dostupne pre domacnost - kamenne dosky nemienim vyuzivat  :)
Na domácí použití je asi dobrá volba ten Data Tresor Disc - akorát se mi na tom trochu nezdá, že to nemá caddy. Riskuješ poškrábání při manipulaci. Anebo použít pásky (Ultrium) s tím, že po cca 25 letech by to chtělo přepsat na v té době aktuálnější médium. Což bude nejspíš potřeba i s tím DTD - média sice můžou vydržet, ale kdoví, jak dostupné budou mechaniky, kolik budou za xx let stát atd.

Zkus si dneska sehnat funkční (když už ne novou) 8" disketovou mechaniku a připoj ji k dnešnímu počítači, ať si vyzkoušíš, jakým tak zhruba problémům budeš čelit :)

Co se týče formátů, s tím plain textem je to určitě krok správným směrem - obecně asi použít co nejjednodušší formát založený na plaintextu. CSV, XML, json apod. Bacha na formáty, které jsou sice taky plaintext, ale děsně složité (odf, docx). Akorát si teda moc neumím představit domácí data tohodle typu, která by za 40 let měla ještě nějakou cenu...

Se složitějšími daty se určitě nevyhneš tomu, že to za 20-30 let budeš muset převést do nějakého v té době aktuálního formátu. Já osobně bych nedoufal ve formát, který bude použitelný za 70 let...
 
Chtěl bych nějak zazálohoval své maily z freemailových služeb (seznam, gmail), tak aby ideálně je bylo možné v případě jejich smazání na serveru je tam IMAP nacpat zpátky. Hlavně ale aby je bylo možné ještě alespoň 10-20 let číst.
- jakým programem ? (pravděpodobně mailový klient jako thunderbird)
- do jakého formátu ? (milion .eml souborů či něco jiného)
Předně na seznam bych se vykašlal. Když neumí dát k dispozici dostatečnou kapacitu, tak proč to používat? Nech si maily přeposílat na gmail a na seznam zapomeň.

A co se týče nástroje, nainstaluj si dovecot, zapni imap, nastav formát mailboxu Maildir a použij program imapsync. Potom budeš mít jeden mail v jednom plaintext souboru, pěkně uspořádané do adresářů a není co řešit.

ivan

Re:Ako archivovat
« Odpověď #6 kdy: 08. 09. 2013, 07:56:30 »
Supis majetku, napriklad pozemky, tam je ta archivacia nutna na dlhu dobu.
To zahrna ako text tak aj obrazky.

V pripade pasky, tiez nemusi byt za 30 rokov dostupna. Samozrejme mozem aj tu archivovat  ;)
Ano v pripade proprietarnych formatov, ktore neumoznuju export do formatu podobnemu plain textu, je to vacsi problem.
Pokial ho nie je mozne nahradit open-source (kvoli zdrojakom), tak asi pribalit aj ten program a spoliehat sa, ze v buducnosti budu virtualizacne riesenia, ktore to budu vediet spustit.
To iste je vsak aj so zdrojakmi, otazka je, ci bude v buducnosti nejaky compiler, ktory to bude vediet USPESNE prelozit.
Zo skusenosti mam vsak vacsi problem v PRIJATELNOM CASE (2-3 hodiny googlovania) najst nejaku staru kniznicu z distribucie starej 13 rokov.

Re:Ako archivovat
« Odpověď #7 kdy: 08. 09. 2013, 08:08:35 »
Supis majetku, napriklad pozemky, tam je ta archivacia nutna na dlhu dobu.
To zahrna ako text tak aj obrazky.
Jo, tak to jo. To mě právě nenapadlo, tu jednu nemovitost, co vlastním, si archivuju v hlavě ;)

V pripade pasky, tiez nemusi byt za 30 rokov dostupna. Samozrejme mozem aj tu archivovat  ;)
30 let je hranice životnosti, takže bych spíš přemýšlel nad 25 lety. A 25 let staré pásky dneska přečíst jdou - DDS mechaniky se pořád dají koupit a jsou zpětně kompatibilní.

Ano v pripade proprietarnych formatov, ktore neumoznuju export do formatu podobnemu plain textu, je to vacsi problem.
Pokial ho nie je mozne nahradit open-source (kvoli zdrojakom), tak asi pribalit aj ten program a spoliehat sa, ze v buducnosti budu virtualizacne riesenia, ktore to budu vediet spustit.
To iste je vsak aj so zdrojakmi, otazka je, ci bude v buducnosti nejaky compiler, ktory to bude vediet USPESNE prelozit.
Zo skusenosti mam vsak vacsi problem v PRIJATELNOM CASE (2-3 hodiny googlovania) najst nejaku staru kniznicu z distribucie starej 13 rokov.
Podle mě přibalení softwaru nic moc neřeší. Pokud to nejde vyexportovat teď, za 30 let to nepůjde tím spíš. A i kdyby ta virtualizace existovala, co mi to pomůže? Můžu si ta data sice prohlídnout, ale stejně je nemůžu z toho dostat... Stejně mi zůstane možnost jenom si udělat screenshot nebo videozáznam, což můžu udělat rovnou teď :)

Re:Ako archivovat
« Odpověď #8 kdy: 08. 09. 2013, 08:14:40 »
P.S. když už jsme u té trvanlivosti platforem, jedna perlička: existuje firma, která z moderních součástek vyrábí systémy plně kompatibilní s prehistorickými VAXy a PDP-11:

http://www.logical-co.com/dec-replacement-systems/

Tomu říkám ochrana investic! ;)

student

Re:Ako archivovat
« Odpověď #9 kdy: 08. 09. 2013, 16:47:56 »
libcha:
Po skusenostiach s mojich zalohovanim odporucam tych milion eml suborov zatarovat po mesiacoch / rokoch. Zatarovat preto, lebo tam nie je kompresia (a je to lahko obnovitelne - format je dobre citatelny) a vacsie pocty suborov su zabijak pre filesystem a nejaky rozumny pristup / kopirovanie.

Inak eml je podla mna rozumny format, lebo je textovy a obsahuje vsetky informacie dobre citatelne.

ivan:
Suhlasim s tym, ze formaty zalozene na textovych budu urcite najlepsie citatelne.
Kedze ale dokazem precitat dokumenty, co maju mozno aj cez 20 rokov a boli ulozene v T602, tak si nemyslim, ze len textove dokumenty budu citatelne.

pavele

Re:Ako archivovat
« Odpověď #10 kdy: 08. 09. 2013, 17:49:42 »
A v případě, že ve výsledném archivu "něco.tar" dojde k jediné chybě na zálohovaném mediu, můžeš se na tento archiv jen smutně dívat a vzpomínat, o které data jsi vlastně přišel... ;D

ivan

Re:Ako archivovat
« Odpověď #11 kdy: 08. 09. 2013, 18:36:47 »
A v případě, že ve výsledném archivu "něco.tar" dojde k jediné chybě na zálohovaném mediu, můžeš se na tento archiv jen smutně dívat a vzpomínat, o které data jsi vlastně přišel... ;D
A tu sa dostavame k dalsim otazkam:
1. ak treba komprimovat, tak potom aky format (aky recovery record nastavit)?
2. ak treba sifrovat, tak potom ...?
3. ak sa napaluje na CD/DVD/Blu-ray, tak potom aky format suborov (ISO, UDF, ich kombinacie)?

Ramtech

Re:Ako archivovat
« Odpověď #12 kdy: 08. 09. 2013, 20:01:41 »
2. https://en.wikipedia.org/wiki/Substitution_cipher a sed
3. zapnúť rock ridge a joliet extension pri vytváraní ISO obrazov alebo rovno UDF

Jakub L.

Re:Ako archivovat
« Odpověď #13 kdy: 08. 09. 2013, 21:29:11 »
Gmail lze zálohovat přes GMvault...

ivan

Re:Ako archivovat
« Odpověď #14 kdy: 08. 09. 2013, 21:41:16 »
3. zapnúť rock ridge
Na co mi bude Rock Ridge? Nechcem zalohovat metadata iba obsah.