דילוג לניווט ראשי דילוג לחיפוש דילוג לתוכן הראשי

Compressed hierarchical clustering

פרסום מחקרי: פרק בספר / בדוח / בכנספרסום בספר כנסביקורת עמיתים

תקציר

Hierarchical Clustering is widely used in Machine Learning and Data Mining. It stores bit-vectors in the nodes of a k-ary tree, usually without trying to compress them. We suggest a double usage of the {\sf xor}ing operations defining the Hamming distance used in the clustering process, extending it also to be used to transform the vector in one node into a more compressible form, as a function of the vector in the parent node. Compression is then achieved by run-length encoding, followed by optional Huffman coding, and we show how the compressed file may be processed directly, without decompression.

שפה מקוריתאנגלית
כותר פרסום המארחProceedings - DCC 2018
כותר משנה של פרסום המארח2018 Data Compression Conference
עורכיםAli Bilgin, James A. Storer, Joan Serra-Sagrista, Michael W. Marcellin
מוציא לאורInstitute of Electrical and Electronics Engineers Inc.
עמודים399
מספר עמודים1
מסת"ב (אלקטרוני)9781538648834
מזהי עצם דיגיטלי (DOIs)
סטטוס פרסוםפורסם - 19 יולי 2018
אירוע2018 Data Compression Conference, DCC 2018 - Snowbird, ארצות הברית
משך הזמן: 27 מרץ 201830 מרץ 2018

סדרות פרסומים

שםData Compression Conference Proceedings
כרך2018-March
ISSN (מודפס)1068-0314

כנס

כנס2018 Data Compression Conference, DCC 2018
מדינה/אזורארצות הברית
עירSnowbird
תקופה27/03/1830/03/18

טביעת אצבע

להלן מוצגים תחומי המחקר של הפרסום 'Compressed hierarchical clustering'. יחד הם יוצרים טביעת אצבע ייחודית.

פורמט ציטוט ביבליוגרפי