Langsung ke konten utama

Pengertian Cluster And Node Hadoop

Asslamu Alaikum Warohmatullah Wabarokatuh







Selain tadi tentang Hadoop Cluster, ada juga konsep data Warehouse dan data lake. Bedanya apa? Kalau  data Warehouse itu lebih berpegang kepada skema-skema database yang structure, sedangkan kalau data lake dia berpegang pada skema database yang semi-structure atau un-structure, walalupun sebenarnya dia juga bisa dipakai untuk yang structure.

Kemudian data Warehouse ini dipakai oleh bisnis professional, jadi dia bisa langsung dianalisis, sedangkan kalau data lake, dia biasanya digunakan oleh data Scientist, karena data Scientist akan melakukan pemrosesan lanjutan, supaya inside dari data lake bisa diambil. Jadinya ilustrasinya seperti ini, secara umum sebenarnya kita sudah mengalami semua ini, jadi ada data sources, kemudian kita melakukan akuisisi, kemudian kita simpanan dan kita analisis.

Kalau untuk data Warehouse, datanya semua structure, kemudian di acquire dengan ETL (Extract Transformer Load), kemudian masuk ke data Warehouse. Kalau dengan data yang unstructured atau semi structures seperti ini, ada teks, ada sensor, ada sosial media data, kita perlu acquire dengan toolstools yang berbeda, yaitu disebut juga sebagai project di Apache.







Kemudian, dia perlu di store dengan skema berbeda juga, makanya ada HDFS, kemudian ada Cassandra atau H Base, kemudian mereka juga akan dianalisis dengan cara yang berbeda. Kita akan go-true masingmasing ini apa? Spark itu apa, Cloudera Impala itu apa, Hive itu apa? Tapi pada intinya, kita mau tidak mau harus menjalankan keduanya berdampingan, jadi yang structure tetap dijalankan dengan prinsip data warehouse, kemudian yang unstructured tetap harus disimpan dan diproses dengan menggunakan skema yang Hadoop.

Berdasarkan video tadi, kita juga sebenarnya sudah bisa melihat, teknologi Hadoop memiliki beberapa manfaat, diantaranya dia bisa skills horizontally artinya dia bisa ditambah secara horizontal, ini akan menghemat dari segi pembelian atau ongkos, kemudian dia bisa meng-handle and structure atau Semi structure data. Kenapa? Karena Hadoop prinsip data lake, jadi seperti danau, masuk saja ke danau, kita tidak paksakan satu skema spesifik untuk data yang disimpan, kemudian dia juga profess storage and computing, jadi ide utamanya adalah satu nude bisa digunakan untuk storage dan processing bersamaan. Kemudian, satu hal lagi adalah resistant to hardware failure. Jadi, seiring perkembangan teknologi kita tahu bahwa semakin sering kita mengalami hardware failures, itu tak terelakkan. Hadoop itu membantu karena node-nya adalah mesin sendiri-sendiri, kemudian dia punya sistem yang meng-copy, jadi semua file yang kita punya di copy, by default 3 kali dan ditaruh di node yang berbeda. Jadi kalau ada apa-apa, kemungkinan untuk kehilangan data, akan menjadi sangat kecil, karena kita punya back-up di node yang berbeda.



Barusan kita mempelajari mengenai simple basic architecture tentang Hadoop. Selanjutnya kita akan membahas lebih detail mengenai HDFS dan MapReduce. 



Wasslamu Alaikum Warohmatullah Wabarokatuh


Kota Tegal ,21 April 2021

#Google #Bigdata #opensource #2021 #April #blogger #hadoop

Terima kasih dan sampai jumpa.

Postingan populer dari blog ini

Mengenal tentang Komunikasi Audio

  KOMUNIKASI AUDIO Komunikasi audio adalah proses penyampaian informasi, pesan, atau komunikasi secara verbal melalui suara atau audio. Ini melibatkan penggunaan perangkat audio seperti mikrofon, speaker, atau perekam suara untuk mentransmisikan dan menerima pesan suara. Dalam komunikasi audio, pesan atau informasi dikodekan dalam bentuk gelombang suara yang dapat didengar oleh penerima. Proses ini melibatkan penggunaan suara manusia atau audio rekaman yang ditransmisikan melalui saluran komunikasi tertentu, seperti telepon, webinar, konferensi audio, radio, podcast, atau platform komunikasi berbasis internet. Komunikasi audio dapat terjadi dalam berbagai konteks, termasuk komunikasi bisnis, pendidikan jarak jauh, pertemuan atau rapat jarak jauh, presentasi, hiburan, dan sebagainya. Pentingnya komunikasi audio dalam berbagai aspek kehidupan telah meningkat secara signifikan dengan kemajuan teknologi dan globalisasi, memungkinkan orang untuk berkomunikasi dengan mudah di berbagai

Cara Menggunakan Vi editor pada Linux Ubuntu Gloudshell Google

Assalamu Alaikum Wr Wb.  Pada Coretan ini, saya akan Sebutkan 4 comand yang sering digunakan SysAdmin & IT Support Dalam menulis mengedit file txt pada mode layar hitam. a.membuat file dengan vi  b.Melihat hasil vi Apa itu editor VI ?       Editor VI adalah editor teks paling populer dan klasik dalam keluarga Linux. Di bawah, adalah beberapa alasan yang menjadikannya editor yang banyak digunakan bagi yang selalu berkerja di balik layar hitam (bukan dunia hitam). Ini tersedia di hampir semua Distribusi Linux. Ini berfungsi sama di berbagai platform dan Distribusi.  Itu ramah pengguna. Karenanya, jutaan pengguna Linux menyukainya dan menggunakannya untuk  kebutuhan pengeditan mereka.       Saat ini, ada versi lanjutan dari vi editor yang tersedia, dan yang paling populer adalah VIM yaitu Vi Improved . Beberapa yang lain adalah Elvis, Nvi, Nano , dan Vile . Adalah bijaksana untuk mempelajari vi karena kaya fitur dan menawarkan kemungkinan tanpa akhir untuk mengedit file .

Apa itu CodeIgniter - MVC Framework

    CodeIgniter didasarkan pada pola pengembangan Model-View-Controller (MVC). MVC adalah pendekatan perangkat lunak yang memisahkan logika aplikasi dari presentasi. Dalam praktiknya, ini memungkinkan halaman web Anda berisi skrip minimal karena presentasinya terpisah dari skrip PHP. Model mewakili struktur data Anda. Biasanya, kelas model Anda akan berisi fungsi yang membantu Anda mengambil, menyisipkan, dan memperbarui informasi dalam database Anda.  View adalah informasi yang disajikan kepada pengguna. Tampilan biasanya akan menjadi halaman web, tetapi di CodeIgniter, tampilan juga bisa menjadi fragmen halaman seperti header atau footer. Ini juga bisa berupa halaman RSS, atau jenis "halaman" lainnya.   Controller berfungsi sebagai perantara antara Model, View, dan sumber daya lain yang diperlukan untuk memproses permintaan HTTP dan menghasilkan halaman web. #codeigneter #bigdata #tegal #september2021