Compressed hierarchical clustering

Gilad Baruch, Dana Shapira, Shmuel T. Klein

نتاج البحث: فصل من :كتاب / تقرير / مؤتمرمنشور من مؤتمرمراجعة النظراء

ملخص

Hierarchical Clustering is widely used in Machine Learning and Data Mining. It stores bit-vectors in the nodes of a k-ary tree, usually without trying to compress them. We suggest a double usage of the {\sf xor}ing operations defining the Hamming distance used in the clustering process, extending it also to be used to transform the vector in one node into a more compressible form, as a function of the vector in the parent node. Compression is then achieved by run-length encoding, followed by optional Huffman coding, and we show how the compressed file may be processed directly, without decompression.

اللغة الأصليةالإنجليزيّة
عنوان منشور المضيفProceedings - DCC 2018
العنوان الفرعي لمنشور المضيف2018 Data Compression Conference
المحررونAli Bilgin, James A. Storer, Joan Serra-Sagrista, Michael W. Marcellin
ناشرInstitute of Electrical and Electronics Engineers Inc.
الصفحات399
عدد الصفحات1
رقم المعيار الدولي للكتب (الإلكتروني)9781538648834
المعرِّفات الرقمية للأشياء
حالة النشرنُشِر - 19 يوليو 2018
الحدث2018 Data Compression Conference, DCC 2018 - Snowbird, الولايات المتّحدة
المدة: ٢٧ مارس ٢٠١٨٣٠ مارس ٢٠١٨

سلسلة المنشورات

الاسمData Compression Conference Proceedings
مستوى الصوت2018-March
رقم المعيار الدولي للدوريات (المطبوع)1068-0314

!!Conference

!!Conference2018 Data Compression Conference, DCC 2018
الدولة/الإقليمالولايات المتّحدة
المدينةSnowbird
المدة٢٧/٠٣/١٨٣٠/٠٣/١٨

بصمة

أدرس بدقة موضوعات البحث “Compressed hierarchical clustering'. فهما يشكلان معًا بصمة فريدة.

قم بذكر هذا