24種用于機器學習的最佳電子商務(wù)和零售數(shù)據(jù)集

一、機器學習的產(chǎn)品數(shù)據(jù)集

  1. Fashion-MNIST:MNIST非常適合產(chǎn)品分類用例,其中包含10個類別的近60,000張時尚產(chǎn)品的訓練圖像和10,000張測試圖像。

    https://github.com/zalandoresearch/fashion-mnist

  2. 來自“維多利亞的秘密”和其他雜志的內(nèi)衣數(shù)據(jù):來自流行零售網(wǎng)站的600,000多種內(nèi)衣產(chǎn)品數(shù)據(jù)。它包括產(chǎn)品說明,價格,類別,評級等。

    https://www.kaggle.com/PromptCloudHQ/innerwear-data-from-victorias-secret-and-others

  3. 電子產(chǎn)品和定價數(shù)據(jù):此數(shù)據(jù)集包含7,000多種電子產(chǎn)品的列表以及10個價格信息字段。

    https://data.world/datafiniti/electronic-products-and-pricing-data

  4. 男鞋價格:10,000張男鞋的清單以及各種售價。

    https://data.world/datafiniti/mens-shoe-prices

  5. 女鞋價格:除了以前的數(shù)據(jù)集之外,它還包含10,000種女鞋的列表以及各種售價。

    https://data.world/datafiniti/womens-shoe-prices

  6. 電子商務(wù)商品數(shù)據(jù):對于推薦系統(tǒng)很有用,該數(shù)據(jù)集包含SKU及其來自戶外服裝品牌產(chǎn)品目錄的相關(guān)產(chǎn)品描述。

    https://www.kaggle.com/cclark/product-item-data/home

  7. Amazon.com上的Fashion Products:這是通過從Amazon提取數(shù)據(jù)而創(chuàng)建的預抓取數(shù)據(jù)集。它由亞馬遜上約22,000種時尚產(chǎn)品組成。

    https://data.world/promptcloud/fashion-products-on-amazon-com

  8. 服裝的電子商務(wù)標簽:此零售數(shù)據(jù)集包含來自電子商務(wù)網(wǎng)站的圖像,在襯衫,夾克,太陽鏡等周圍畫有邊框。它有907個項目,其中504個項目已手動標記。

    https://dataturks.com/projects/devika.mishra/E-commerce%20Tagging%20for%20clothing

二、機器學習的零售交易數(shù)據(jù)集

  1. 在線零售數(shù)據(jù)集(UCI機器學習存儲庫):此數(shù)據(jù)集包含一個總部位于英國的在線零售公司在八個月內(nèi)(01/12 / 2010-09 / 12/2011)的所有交易。

    https://www.kaggle.com/carrie1/ecommerce-data/home

  2. 巴西電子商務(wù)公共數(shù)據(jù)集:此數(shù)據(jù)集包含2016年至2018年在多個市場在Olist上做出的100,000多個巴西匿名訂單(100k訂單)。此外,它包括從訂單狀態(tài),價格,付款和貨運績效到客戶的真實書面評論的多個維度。

    https://www.kaggle.com/olistbr/brazilian-ecommerce/home

  3. Online Auctions數(shù)據(jù)集:零售數(shù)據(jù)集,其中包含Cartier手表,Xbox游戲機,Palm Pilot M515 PDA和Swarovski珠子上的eBay拍賣數(shù)據(jù)。

    https://www.kaggle.com/onlineauctions/online-auctions-dataset/home

  4. Retailrocket推薦系統(tǒng)數(shù)據(jù)集:此數(shù)據(jù)是在4.5個月的時間內(nèi)從真實的電子商務(wù)網(wǎng)站收集的。此外,它還包含有關(guān)訪客行為的信息,包括點擊,添加到購物車和交易等事件。

    https://www.kaggle.com/retailrocket/ecommerce-dataset/home

三、機器學習的電子商務(wù)搜索相關(guān)性數(shù)據(jù)集

  1. 電子商務(wù)搜索相關(guān)性:此集合包含圖像URL,頁面排名,每種產(chǎn)品的描述,導致每種結(jié)果的搜索查詢以及來自五個主要英語電子商務(wù)網(wǎng)站的更多信息。

    https://data.world/crowdflower/ecommerce-search-relevance

  2. 百思買搜索查詢NER數(shù)據(jù)集:零售數(shù)據(jù)集,包含在bestbuy.com上帶有手動標記的搜索查詢。搜索查詢中的短語被標記為各種重要實體,例如品牌,型號名稱,類別名稱等。

    https://dataturks.com/projects/Mohan/Best%20Buy%20E-commerce%20NER%20dataset

四、用于機器學習的客戶審查數(shù)據(jù)集

  1. 女士電子商務(wù)服裝評論:另一個電子商務(wù)數(shù)據(jù)的絕佳資源,此Kaggle數(shù)據(jù)集包含23,000個真實的客戶評論和評分。但是,由于其特征是真實的商業(yè)數(shù)據(jù),因此所有信息都已匿名化。因此,在評論文本和正文中對公司的引用已被替換為“零售商”。

    https://www.kaggle.com/nicapotato/womens-ecommerce-clothing-reviews/home

  2. Amazon Commerce評論集:此零售數(shù)據(jù)集用于在線Writeprint中的作者身份識別,Writeprint是模式識別的新研究領(lǐng)域。此外,為了檢查分類算法的魯棒性,我們確定了50個最頻繁發(fā)布評論的最活躍用戶。

    https://archive.ics.uci.edu/ml/datasets/Amazon+Commerce+reviews+set

  3. 多域情感分析數(shù)據(jù)集:稍舊的零售數(shù)據(jù)集,其中包含按產(chǎn)品類型和等級劃分的產(chǎn)品評論數(shù)據(jù)。此外,評論包含星級(1到5顆星),可以根據(jù)需要將其轉(zhuǎn)換為二進制標簽。

    http://www.cs.jhu.edu/~mdredze/datasets/sentiment/

  4. 亞馬遜和百思買電子:來自50種電子產(chǎn)品的7,000多個在線評論列表。除了評論本身之外,數(shù)據(jù)集還包括日期,來源,等級,標題,評論者元數(shù)據(jù)等。

    https://data.world/datafiniti/amazon-and-best-buy-electronics

  5. 語法和在線產(chǎn)品評論:這是Datafiniti的一個大型數(shù)據(jù)集的示例。它包含超過70,000條評論的列表,可用于許多機器學習用例。例如,您可以評估寫作質(zhì)量如何影響正面和負面的在線產(chǎn)品評論。

    https://data.world/datafiniti/grammar-and-online-product-reviews

  6. 機器學習的電子商務(wù)數(shù)據(jù)集

    年度零售貿(mào)易調(diào)查(ARTS):此數(shù)據(jù)集提供了在美國境外持有的年度總銷售,運營費用和庫存的國家估計。

    https://catalog.data.gov/dataset/annual-retail-trade-survey

  7. 經(jīng)濟普查:經(jīng)濟普查每五年對國家和地方一級的行業(yè)和社區(qū)的商業(yè)活動進行詳細描述。

    https://catalog.data.gov/dataset/economic-census

  8. E-Stats:美國政府的該數(shù)據(jù)集報告了無論通過開放式網(wǎng)絡(luò)(例如Internet)在線銷售的商品和服務(wù)的價值。

    https://catalog.data.gov/dataset/e-stats

  9. 歐盟對外貿(mào)易數(shù)據(jù)集:另一個政府數(shù)據(jù)集,歐盟對外貿(mào)易數(shù)據(jù)集提供有關(guān)按商品,按原產(chǎn)國或目的地分類的進出口,貿(mào)易順差值的信息。

    https://ec.europa.eu/eurostat/web/international-trade-in-goods/data

  10. 1999-2015年按商品類別劃分的電子商務(wù)銷售額:此數(shù)據(jù)集包含真實的普查數(shù)據(jù),該數(shù)據(jù)顯示了按商品類別劃分的電子商務(wù)總銷售額以及1999-2015年的復合年增長率。

    https://www.census.gov/data/tables/2015/econ/e-stats/2015-e-stats.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容