About Tolga Tezel

This author has not yet filled in any details.
So far Tolga Tezel has created 4 blog entries.
30 11, 2021

Spark – MongoDB entegrasyonu ile tabloları MongoDB’den HDFS ortamına aktarmak

By |2021-11-30T14:58:10+03:00November 30th, 2021|BIG DATA|0 Comments

Merhabalar bu yazımda size başka bir clusterde bulunan mongo databasesinde yer alan bir collectionu spark-mongo connector yardımıyla HDFS’e bir tablo olarak yazmayı göstereceğim.

İlk olarak kavramlardan biraz bahsetmek istiyorum.

Spark:  Büyük veri ortamlarında veri işleme için open source bir hesaplama frameworkudur. Pyspark ise Python’da Apache Spark için bir arayüzdür. Python programlama dilini kullanarak uygulamalar yazmanıza imkan tanır.

MongoDB:

9 11, 2020

APACHE ATLAS

By |2023-01-17T11:39:22+03:00November 9th, 2020|BIG DATA|0 Comments

Apache Atlas, Hadoop clusterleri üzerinde data governance(veri yönetişimi) ve metadata yönetimi için araçtır. Metadataları toplamak, işlemek ve sürdürmek için tek başına bir çözümdür.

Ölçeklendirilebilir ve genişletilebilir bir hizmet setidir. Kullanıcıların, veri ekosistemindeki servislere ait metadataların tek bir yerden yönetmesini sağlar.

Atlas nasıl çalışır?

Apache

24 07, 2020

Logstash ile ELK Uygulamaları Tasarlamak

By |2021-10-04T14:50:17+03:00July 24th, 2020|BIG DATA|0 Comments

Selamlar herkese bu yazımda ELK stack yapısında bulunan Logstash’e giriş yapıp, teori ve uygulamalar ile uçtan uca Logstash pipelinelarını göstereceğim.

1. Logstash

Logstash, çok sayıda kaynaktan veri alabilen, dönüştüren ve daha sonra başka kaynaklara gönderebilen açık kaynaklı bir veri işleme hattıdır.

Go to Top