[Spark] Spark에서 테이블 저장
save, saveAsTable 비교 / writeTo, insertInto
Posted by
Wonyong Jang
on January 24, 2025 ·
3 mins read
[ELK] ElasticSearch에서 cardinality 사용시 주의사항과 해결방안
cardinality는 정확한 distinct 값을 계산하지 못한다 / scripted metric
Posted by
Wonyong Jang
on January 22, 2025 ·
5 mins read
[Web] 달력 주차 ISO 8601 를 이용하여 표준화 하기
연간 주차 계산(24W52) / year week 구할 때 주의사항
Posted by
Wonyong Jang
on January 15, 2025 ·
5 mins read
[ELK] ElasticSarch에서 wildcard 쿼리 대신 n-gram으로 성능 개선하기
term level query 방식인 wildcard 검색에서의 문제점 / n-gram 적용 및 search analyzer
Posted by
Wonyong Jang
on December 29, 2024 ·
9 mins read
[DB] 카산드라 CQL(Cassandra Query Language)
데이터 타입(Data Type) 및 쿼리 사용법 / Partition key, Primary key, Clustering key
Posted by
Wonyong Jang
on December 15, 2024 ·
4 mins read
[DB] Apache Cassandra(카산드라)
mongoDB와 비교
Posted by
Wonyong Jang
on December 14, 2024 ·
4 mins read
[Spark] PySpark 개발환경 구성과 주요기능
scala 와 python 을 이용한 Spark 비교 / Temp View / Python Package Management / spark-submit 옵션
Posted by
Wonyong Jang
on August 08, 2024 ·
11 mins read
[DevOps] Jenkins Batch to Airflow
젠킨스 배치의 문제점 / 젠킨스 배치를 airflow와 쿠버네티스(k8s) Job 으로 전환
Posted by
Wonyong Jang
on August 02, 2024 ·
5 mins read