
一、校驗數字的表達式 數字:^[0-9]*$ n位的數字:^\d{n}$ 至少n位的數字:^\d{n,}$ m-n位的數字:^\d{m,n}$ ...
文本挖掘是從大量文本中,比如微博評論,知乎評論,JD,天貓淘寶大量評論中的文本中抽取出有價值的知識,并利用這些知識創造出價值,實現變現的一個過程...
一、PV、UV和IP的定義 PV: Page View,訪問量。即頁面瀏覽量或點擊量,用戶每次刷新即被計算一次。 UV:Unique Visi...
一、建立合適的索引 在常用過濾條件、表連接的字段建立索引。但并不是所有索引對查詢都有效,MySQL如果掃描數據超過30%,都會走全表。 二、在w...
一、SVD介紹 在實際生活中,采集到的數據大部分信息都是無用的噪聲和冗余信息,為了剔除掉這些噪聲和無用的信息,只保留包含絕大部分重要信息的數據特...
一、降維介紹 降維是對數據高維度特征的一種預處理方法。降維是將高維度的數據保留下最重要的一些特征,去除噪聲和不重要的特征,從而實現提升數據處理速...
一、FP-growth介紹 從大規模的數據集中,尋找不同特征或者物品之間的隱含關系,稱為關聯分析(association analysis),或...
一、關聯分析介紹 商場的銷售過程,涉及很多機器學習的應用,商品的陳列,購物卷的提供,用戶忠誠度等等,通過對這些大量數據的分析,可以幫組商店了解用...
一、K-means聚類介紹 聚類是一種無監督的學習,它將相似的對象歸到同一個簇中。它有點像全自動分類 。聚類方法幾乎可以應用于所有對象,簇內的對...