Souborový systém pro big data

Benda

Souborový systém pro big data
« kdy: 04. 11. 2012, 01:40:16 »
Zdravim,
resim v zamestnani problem s ukladanim dat.
Zakoupil jsem server SuperMicro s 10x 2TB disky a rad bych ho vyuzil jako  iSCSI uloziste pro virtualni servery pod vmware.
Zkousim Centos 6.3 x64 + zfs (presneji zfsonlinux.org)
Vse funguje, ale i tak mam trosku obavu ohledne spolehlivosti.
Ma nekdo zkusenosti s necim podobnym??
« Poslední změna: 05. 11. 2012, 20:58:49 od Petr Krčmář »


Re:file system vhodny na BIG DATA
« Odpověď #1 kdy: 04. 11. 2012, 09:45:59 »
Zdravíčko,
na zfsonlinux jsem se koukal taky a měl bych strach to nasadit do produkce. V práci jsem potřeboval rychle nasadit úložiště se ZFS, takže jsem sáhnul po Nexentě. Za rok jsem si byl už se Solarisem natolik jistý, že jsem z Nexenty přešel na OpenIndianu. Rozumnou podporu ZFS má i FreeBSD. Jaký plánujete typ RAIDu? Co je to za krabici od toho Supermicra? Byl v tom i motherboard se  SAS řadičem? Počítáte také s disky pro systém, L2ARC a ZIL? Kolik RAM plánujete osadit?

Benda

Re:file system vhodny na BIG DATA
« Odpověď #2 kdy: 04. 11. 2012, 10:35:58 »
jedna se o 3U server (2x800W PSU) 16 x 3,5",
v konfiguraci 2x 500GB (RAID 1)   10x 2TB (RAID 6)
je osazen radicem LSI MegaRAID SAS 9260-16i
8GB RAM
4x core Xeon
 

Re:file system vhodny na BIG DATA
« Odpověď #3 kdy: 04. 11. 2012, 10:59:06 »
Zkousim Centos 6.3 x64 + zfs (presneji zfsonlinux.org)
Vse funguje, ale i tak mam trosku obavu ohledne spolehlivosti.
Ma nekdo zkusenosti s necim podobnym??
Môj malý domáci server (Atom D525 + 4GB RAM + 2TB +3TB disky) som prevádzkoval asi 2 roky na Gentoo+zfsonlinux.
Asi pred týždňom som prešiel na FreeBSD.
Všetko, čo doma potrebujem (Apache+PHP+Mysql, nfs, Sambu, Postgresql, Tomcat) som nastavil za 2 dni bez väčších problémov, jediný problém mi teraz robí tlačiareň.
 Výkon diskov sa na rovnakom železe zvýšil niekoľkonásobne, FreeBSD+zfs je v oveľa viac otestovaná v produkčnom nasadení ako zfsonlinux, preto je to podľa mňa lepšia volba.

Re:file system vhodny na BIG DATA
« Odpověď #4 kdy: 04. 11. 2012, 11:28:59 »
Počítáte také s disky pro systém, L2ARC a ZIL? Kolik RAM plánujete osadit?
L2ARC a ZIL disky určite pomôžu výkonu, ja používam na desktope (Gentoo amd64 + zfs) raidz1:
Kód: [Vybrat]
  pool: desktop
 state: ONLINE
 scan: scrub repaired 0 in 2h18m with 0 errors on Sat Nov  3 02:02:41 2012
config:

        NAME                                               STATE     READ WRITE CKSUM
        desktop                                            ONLINE       0     0     0
          raidz1-0                                         ONLINE       0     0     0
            ata-ST3320418AS_5VM1GR1M-part2                 ONLINE       0     0     0
            ata-WDC_WD10EARS-00Y5B1_WD-WCAV5N460072-part2  ONLINE       0     0     0
            ata-SAMSUNG_HD154UI_S1XWJ1KS811196-part2       ONLINE       0     0     0
        logs
          sda3                                             ONLINE       0     0     0
        cache
          ata-OCZ-AGILITY3_OCZ-R672ME4QSRZI2CU5-part4      ONLINE       0     0     0

errors: No known data errors
a rozmýšľam ako dostať nejaký SSD disk na server, ale moja doska toho veľa neumožňuje. PCI mám obsadenú sieťovkou a USB2 je pomalé.


Re:file system vhodny na BIG DATA
« Odpověď #5 kdy: 04. 11. 2012, 11:59:14 »
Vse funguje, ale i tak mam trosku obavu ohledne spolehlivosti.
Vůbec nepíšeš, na jaké nasazení se to má použít - jestli pro tvoje osobní účely, pro testování, pro vývoj, ...?

Podle mě je tohle konkrétní řešení dobré tak akorát na odpolední hraní si, večerní wow efekt a to je asi tak všechno. Nasadit to do ostré produkce, to mi přijde spíš jako hodně černý humor - na derivátu Solarisu bez mrknutí oka, na FreeBSD dneska už jo (s dostatkem RAM a možná lehkým dotuněním), ale na Linuxu?! Ufff... A v kombinaci s iSCSI už je to úplný sci-fi.

Benda

Re:file system vhodny na BIG DATA
« Odpověď #6 kdy: 05. 11. 2012, 14:51:56 »
Na samozrejme ze ho chci pouzit do ostreho provozu. Urceno na archivaci velkeho objemu dat.
Linux jsem pouzil z duvodu instalace podpurneho SW od vyrobce LSI.
Premyslim ze tak rozbehnu FreeNAS. Nevím jak to potom dopadne s obsluhou raid controlleru.
 

RDa

  • *****
  • 2 655
    • Zobrazit profil
    • E-mail
Re:file system vhodny na BIG DATA
« Odpověď #7 kdy: 05. 11. 2012, 15:23:27 »
iSCSI umi pristup primo na soubory, ze je nutne nasazovat ZFS? V pripade sdileni disku ven, bych pouzil maximalne tak LVM a filesystem neresil.

Benda

Re:file system vhodny na BIG DATA
« Odpověď #8 kdy: 05. 11. 2012, 18:00:22 »
Mim cilem je takovy lepsi NAS (iSCSI, ftp, samba).
Na rychlost nemam zadne naroky, kdyz to pobezi 10Mbit/s pro zapis tak mi to staci. PRistup bude jen pro 2 servery.
Nejdulezitejsi je dostupnost a moznost vymenit vadny hdd za chodu.

Benda

Re:file system vhodny na BIG DATA
« Odpověď #9 kdy: 05. 11. 2012, 18:01:55 »
Mým cílem  :) :) no fuj to jsem se upsal

Re:file system vhodny na BIG DATA
« Odpověď #10 kdy: 05. 11. 2012, 19:22:36 »
Nejdulezitejsi je dostupnost a moznost vymenit vadny hdd za chodu.
Dobré dostupnosti těžko dosáhneš nasazením experimentální technologie. Vyměňovat vadné HD za chodu můžeš na libovolném RAIDu. Pokud ti jde primárně o dostupnost, kup pořádný hardwarový RAID, dej na to nějaký léty prověřený filesystém a nevymýšlej kraviny :)

Benda

Re:Souborový systém pro big data
« Odpověď #11 kdy: 05. 11. 2012, 21:02:15 »
OK takze tvoje rada je nasadit ext4 

Re:Souborový systém pro big data
« Odpověď #12 kdy: 05. 11. 2012, 22:34:04 »
OK takze tvoje rada je nasadit ext4
Moje rada je nasadit do produkce ověřenou a podporovanou technologii a nebláznit :)

Benda

Re:Souborový systém pro big data
« Odpověď #13 kdy: 06. 11. 2012, 09:38:32 »

Moje rada je nasadit do produkce ověřenou a podporovanou technologii a nebláznit :)
[/quote]
Moc jsi me nepomohl

tadeas

Re:Souborový systém pro big data
« Odpověď #14 kdy: 06. 11. 2012, 09:49:34 »
Moc jsi me nepomohl
ext3, ext4, xfs.