資料探勘

4 Articles

資訊擷取技術原理應用與系統架構

資訊擷取技術是從非結構化文字中提取結構化資訊的關鍵技術,應用於商業智慧、履歷表篩選等領域。本文探討資訊擷取的原理、技術方法(命名實體識別、關係抽取)以及系統架構,並以 Python 和 NLTK、BERT

關聯規則挖掘:理論、演算法與應用實踐

本文探討關聯規則挖掘的理論基礎、流程與常用演算法,包含 Apriori 與 FP-Growth,並深入探討量化關聯規則挖掘的挑戰和解決方案,涵蓋支援度和信心度的衝突、資訊理論方法和叢集方法,並比較不同 QAR Mining 方法的優缺點。

關聯規則探勘與協同過濾技術

本文探討關聯規則探勘與協同過濾技術,闡述如何從交易資料中挖掘頻繁項集,並生成具有高支援度和信賴度的關聯規則。同時,文章也介紹了 Apriori 演算法、支援度、信心度和提升比率等關鍵概念,並以手機面板購買案例說明如何應用這些技術於實際場景。

二元變數強相關性查詢的挑戰與機會

本文探討在資料探勘中,強相關性專案查詢的挑戰與機會,尤其是在設定相關性閾值與處理排名聯絡上的困難。文章深入探討了 Spearman