<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://demanejar.github.io/posts/redis-101-(part-1)/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/mapreduce-programming-model/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/hadoop-introduction/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/install-and-deploy-hadoop-single-node/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/hadoopo-ecosystem/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/hdfs-introduction/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/hdfs-commands/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/Kafka-In-Depth/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/Apache-Nifi/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/Docker/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/hadoop-mapreduce-and-wordcount-project/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/hadoop-question/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/spark-introduction/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/spark-rdd/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/install-apache-spark-ubuntu/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/word-count-with-spark-submit-and-spark-shell/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/spark-sql-dataframe-dataset/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/retail-data-analytics-with-spark-sql/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/spark-sql-window-function-pivot/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/spark-sql-window-function-pivot-part-2/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/spark-streaming/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/Multithread-Multiprocess-in-Python/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/socket-stream/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/log-analyzer/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/install-zeppelin/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/spark-streaming-kafka/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/mode-in-spark/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/sparkml/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/what-is-crawler-and-something/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/no-need-protected-website-from-scraping/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/crawl-housing-data-from-alonhadat/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/add-proxy-to-scrapy-project/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/crawl-1000-website-new-with-scrapy/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/php-scraper/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/scrapy-shell/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/scrapy-with-splash/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/airflow-ha/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/data-lineage-tracking-and-visualization-solution-with-spline/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/some-trick-crawler/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/selenium-middleware-custom-scrapy/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/posts/k8s/</loc>
<lastmod>2026-01-02T21:02:08+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/categories/</loc>
<lastmod>2026-01-02T21:02:53+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/tags/</loc>
<lastmod>2026-01-02T21:02:53+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/archives/</loc>
<lastmod>2026-01-02T21:02:53+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/about/</loc>
<lastmod>2026-01-02T21:02:53+07:00</lastmod>
</url>
<url>
<loc>https://demanejar.github.io/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/nosql/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/bigdata/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/ubuntu/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/redis/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/mapreduce/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/java/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/hadoop/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/apache-hadoop/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/hdfs/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/hadoop-yarn/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/hadoop-ecosystem/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/pig/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/kafka/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/zookeeper/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/hive/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/hbase/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/sqoop/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/data-ingestion/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/apache-kafka/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/big-data/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/apache-nifi/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/docker/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/hadoop-mapreduce/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/mapreduce/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/spark/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/hadoop-vs-spark/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/apache-spark/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/rdd/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/spark-sql/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/pivot-spark/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/window-function/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/spark-streaming/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/python/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/zeppelin/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/kafka-consumer/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/yarn/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/mesos/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/apache-mesos/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/flask/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/spark-mllib/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/lda/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/crawler/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/scrapy/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/selenium/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/protected-website/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/alonhadat/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/proxy/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/mysql/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/php/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/php-crawler/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/scrapy-shell/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/splash/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/ha/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/airflow/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/data-lineage/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/spline/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/spark-agent/</loc>
</url>
<url>
<loc>https://demanejar.github.io/tags/k8s/</loc>
</url>
<url>
<loc>https://demanejar.github.io/categories/blogging/</loc>
</url>
<url>
<loc>https://demanejar.github.io/categories/hadoop-spark/</loc>
</url>
<url>
<loc>https://demanejar.github.io/categories/hadoop/</loc>
</url>
<url>
<loc>https://demanejar.github.io/categories/spark/</loc>
</url>
<url>
<loc>https://demanejar.github.io/categories/crawler/</loc>
</url>
<url>
<loc>https://demanejar.github.io/page2/</loc>
</url>
<url>
<loc>https://demanejar.github.io/page3/</loc>
</url>
<url>
<loc>https://demanejar.github.io/page4/</loc>
</url>
<url>
<loc>https://demanejar.github.io/page5/</loc>
</url>
<url>
<loc>https://demanejar.github.io/viblo-site-verification.html</loc>
<lastmod>2026-01-02T21:02:33+07:00</lastmod>
</url>
</urlset>
