• 전체
  • 전자/전기
  • 통신
  • 컴퓨터
닫기

사이트맵

Loading..

Please wait....

국내 학회지

홈 홈 > 연구문헌 > 국내 학회지 > 데이터베이스 연구회지(SIGDB)

데이터베이스 연구회지(SIGDB)

Current Result Document : 5 / 5

한글제목(Korean Title) Spark 기반의 분산 시간 count-min 스케치 기법
영문제목(English Title) Distributed temporal count-min sketch techniques based on Spark
저자(Author) Fadhilah Kurnia Putri   안성아   권준호   Fadhilah Kurnia Putri   Seonga An   Joonho Kwon  
원문수록처(Citation) VOL 33 NO. 01 PP. 0114 ~ 0128 (2017. 04)
한글내용
(Korean Abstract)
사물 인터넷 (Internet of Things, IoT) 기술의 급속한 발전으로 인해 많은 양의 교통 데이터가 다양한 IoT 센서로부터 생성된다. 중요한 응용 중의 하나는 IoT 디바이스로부터 생성된 데이터 스트림에 대한 top-k 질의에 대한 답을 구하는 것이다. 이 논문에서는 기존의 시간 count-min 스케치를 분산 모드로 확장한 슬라이딩 윈도우에 기반한 count-min 스케치 기법(CMSS)와 지수 count-min 스케치 기법 (ECM)을 제안한다. 이 두 기법은 Spark을 이용하여 구현이 되었으며, 택시 여행 데이터 셋에 대한 근사 top-k 질의처리를 위해 사용한다. 실험 결과를 통해 CMSS 기법이 메모리 소비 및 실행 시간 측면에서 ECM 기법 보다 우수하고, ECM 기법은 CMSS보다 더 정확한 결과를 반환하는 것을 보인다.
영문내용
(English Abstract)
Due to the rapid development of Internet of Things (IoT) technologies, large volumes of traffic data are generated from IoT sensors. One of the crucial applications is to answer top-K queries over data stream from IoT devices. In this paper, we extended the existing temporal count-min sketches in a distributed mode: CM-Sketch on sliding window (CMSS) and Exponential-CM Sketch (ECM). These two techniques are implemented on a Spark engine and utilized for answering the approximate top-k query processing over taxi trip dataset. Our experimental results shows that CMSS performs better than ECM in terms of the memory consumption and execution time, whereas ECM produce more accurate results than CMSS.
키워드(Keyword) 분산 스케치   시간 count-min 스케치   사물 인터넷   교통 정보   Distributed sketch   temporal count-min sketch   Internet of things   Traffic information  
파일첨부 PDF 다운로드