<noframes id="fpxfr"><listing id="fpxfr"><listing id="fpxfr"></listing></listing>

      <address id="fpxfr"></address>

      <address id="fpxfr"><th id="fpxfr"><progress id="fpxfr"></progress></th></address>

      基于電商用戶行為數據的可視分析研究

      2022-04-27 20:24費千笑
      商場現代化 2022年4期
      關鍵詞:電商

      摘 要:隨著互聯網發展,在線交易成為了一種新興的電子商務模式,在我國也有越來越多企業認識到這一新型商業模式所帶來的巨大經濟效益。在線交易行為產生了大量交易數據,其中包括的一種比較典型的數據類型就是用戶購買行為數據。用戶購買行為數據中包含了眾多人在購物時的行為規模和購買偏好等信息,對相關研究乃至商業的個性化推薦等方面都具有一定的推動作用。本文基于阿里天池的淘寶用戶行為數據,采用可視化分析的手段,從時間維度、用戶行為、商品分析方面對數據進行了多維度的分析,從中發現了一些有價值的用戶消費行為模式和偏好,比如淘寶用戶在購物時的消費習慣、消費偏好習慣等,對行為研究、個性化推薦等方面的研究與應用具有一定的意義。

      關鍵詞:電商;行為數據;可視分析

      一、引言

      人類在日常的行為和生產活動中產生了大量的行為數據。這類數據中包含了用戶在網絡平臺進行各項操作的行為偏好和規律等。在行為數據中,一種很典型的數據就是用戶在電商平臺購買物品過程產生的行為數據,也可以稱之為電商用戶行為數據,它反映了網絡用戶的購物傾向,以及商品的銷售規律等信息,對電商用戶行為數據進行分析有很大的價值。

      對這種行為數據進行分析與可視化,可以挖掘數據背后潛在的人類的行為模式,從而推動行為研究、行為分析等領域的研究與發展。目前針對于電商行為數據的可視分析研究中很多是針對銷售數據進行研究和處理,如劉珊運用B2B交易平臺的交易數據對商品進行分析;ZorattiS在社會化媒體時代企業傳播實戰寶典中利用數據挖掘事物間的關聯性到精準營銷中;陳燁等人運用社會網絡分析構建不同類型用戶社交網絡有效挖掘用戶行為特征;KennedyDS從移動互聯網的角度提出用戶行為畫像的具體實施方法;Mueller等人基于Twitter 會員的相關數據集,創立了NamChar名稱分類器,通過預測用戶性別構建用戶畫像。但是,針對此類數據的分析研究中,大多數都是從單一的角度入手進行分析,這就會導致分析結果存在一定的局限性。尤其針對行為數據時,從單一的視角很難觀察到人類復雜的行為特征。

      基于上述研究現狀,在本文中采用阿里天池的淘寶用戶行為數據,應用可視分析的手段,從多維度對數據進行分析,主要包括時間維度、用戶操作行為維度、商品分析。從而從多個視角了解用戶在不同維度下的各類操作的規模、模式,還能綜合多維度的分析結果,還原人類復雜的購物行為。經過分析,本文提出的方法能夠挖掘時間段內用戶的時間行為偏好、購買商品偏好、購買習慣偏好,有助于發掘行為規律,推動相關研究發展。

      二、數據與可視分析任務描述

      1.數據描述與預處理

      本文的樣本數據來源于天池阿里云提供的淘寶用戶行為數據集。該數據集描述了淘寶用戶在2014年11月-2014年12月內在淘寶App中的一系列操作行為數據。該數據集的原始規模有8.90MB,包含用戶編號、商品編號、行為類型、用戶地理位置、商品種類、行為發生時間六個字段。對數據進行處理后,共包括1048575條記錄,時間跨度48天,涉及到8477位用戶和701610件商品,7095類商品。

      2.可視分析任務

      本文總結了在電商用戶行為中行為用戶操作類型與具體操作行為數據中應當核心關注的內容,從而指導本文中可視分析任務的設計,主要有以下內容。

      T1:分析群體與個體操作行為的時間偏好規律。即不同時間粒度下不同用戶的操作行為。

      T2:分析群體與個體進行購買行為的數量偏好。即用戶短期內購買商品的頻次分析。

      T3:分析群體在線上購物的總體行為偏好。如各項操作的頻率與購買偏好。

      T4:分析商品的瀏覽、銷售等規律。各操作與商品之間的分析。

      三、電商數據的用戶行為可視分析

      基于處理后的數據集以及分析任務,本文設計用戶行為可視分析方法,從不同時間粒度進行用戶活躍度分析、用戶操作行為分析、商品分析等。

      1.不同時間粒度的用戶活躍度分析

      本節分別選取了2014年11月-12月,一天中所有用戶的操作行為數量的總和,并按照天進行統計與展示;選取了整個時間段中,一天內所有用戶的操作行為數量的總和,并按照小時進行統計與展示。本文將上述不同時間粒度下用戶的操作行為定義為“用戶活躍度”。

      2014年11月-12月,用戶的總體活躍度如圖1(a)所示?;趫D可得,折線整體趨于平緩,且明顯存在兩個峰值,峰值一是每月11日-13日,峰值二是一月中的17日-19日,此二峰值均處于“雙十一”前后,故認為由于“雙十一”優惠活動使得用戶在該時間段操作頻繁。

      一天中用戶活躍度如圖1(b)所示。在圖中可以發現,從0點至24點,整體呈先減少后增加再減少的趨勢,并存在2個谷值和1個峰值。谷值一是每天凌晨2點-5點,谷值二為每天16點-18點,兩個時間段中,大部分用戶處于工作或睡眠狀態,因而活躍度較低。峰值是21點-22點,該時間大部分用戶處于非工作時間,網購的活躍度普遍較高。這在一定程度上也反映了大部分用戶網購的時間規律。

      2.用戶操作行為分析

      (1) 用戶購買數量分析

      本節對11月-12月之間,用戶購買商品的數量進行了分析。據初步統計,大部分購買者購買物品都是在9件以內,為便于更深入的理解與分析,也為了解大多數用戶購買商品的差異性,本文將購買細分為購買1件、購買2-4件、購買5-8件、購買9-100件四個數量級。結果如圖2所示。

      根據圖2(a)的漏斗圖可以發現,用戶整體購買商品的數量呈現遞減的趨勢。其中,購買1件商品的人數極多,購買2-4件商品的人數與之類似,即大部分人屬于消費數量較少的少數需求,謹慎消費的狀態。在8477人中,只有82人購買了9件以上的商品,說明大量消費人數占極少比例,該類用戶可能存在大量需求,也可能為具有沖動。

      把用戶購買商品的數量繪制成折線圖如圖2(b)所示。其中,橫軸代表購買商品的數量,縱軸代表購買該數量商品的用戶數量。從圖中可發現,整體呈現遞增趨勢。在購買商品數量在9-82件時,整體呈現平緩狀態,這從另一個角度反映了極大部分用戶在短時間內均為單次小數目購買。

      (2) 用戶操作行為分析

      本節對用戶在11月-12月時間跨度下的付款、加購、瀏覽、支付四種操作行為進行了可視化分析。用戶操作行為分析從用戶五種操作的結合、用戶的“收藏-加購-支付”行為和用戶的“瀏覽-支付”三個方面來做。

      一方面結合了用戶的五種操作,并通過折線圖來展示用戶行為間的關系,并對用戶的付款、加購、瀏覽、支付的行為進行數量大小比較。結果如圖3(a)所示。其中,用戶操作次數和用戶瀏覽次數整體呈現先減少再增長又減少趨勢,與人本身作息規律相符。而另外三種操作,即用戶付款、用戶收藏、用戶加購的次數,整體呈現平緩趨勢,且與用戶瀏覽次數差距較大。綜上可得,用戶大部分操作都是瀏覽,支付的操作是遠小于瀏覽。

      二方面是結合了用于收藏-加購-付款三種操作間的關系。通過形成折線圖與柱狀圖對其進行趨勢分析,如圖3(c)可以得到,收藏-加購-付款數額整體呈現相同趨勢,付款數額遠小于收藏數額,用戶的消費沖動不足以支撐每件商品的購買,而收藏數額遠小于加購數額,其原因為用戶更喜歡用加購習慣來對商品進行標記。局部來看,收藏數額波動更大,受個體差異習慣影響較大。

      三方面是針對于瀏覽-支付分時轉化率間用戶分析。通過形成折線圖3(d)對其進行趨勢分析??傮w來看,瀏覽-支付比率整體呈現平緩趨勢,即用戶消費習慣在一天中基本處于穩定狀態。局部而言,在每天10時-15時情況下,轉化率突增,推測用戶此時購買為剛需產品,從而增高轉化率。

      (3) 轉化率分析

      本文對11月-12月時間跨度下,用戶購買商品的轉化率進行了分析,即用戶進行其他操作至最終支付的情況。本文將轉化率分為以下四個路徑。路徑一:從用戶瀏覽商品至收藏商品,再到加購商品,最終支付該商品。路徑二:從用戶瀏覽商品至加購商品到最終支付該商品。路徑三:從用戶瀏覽商品至收藏商品到最終支付該商品。路徑四:從用戶瀏覽商品后至直接支付該商品。在本節中,計算了上述四種路徑的支付轉化率,即并繪制了頻率分布直方圖展示各路徑下支付的轉化率,如圖4所示。

      圖4(a)是路徑1的轉化率,圖中絕大部分轉化率集中在0-0.2區間,即處于一種低轉化率狀態,這種路徑較復雜,涉及到較多的操作,故極少有用戶在購買物品時全部完成這些所有操作后最終支付商品。圖4(b)為路徑2的轉化率,其轉化率數值區間集中于0-0.45之間,其轉化率相較于其他類型轉化率較高,該操作步驟符合消費者一般操作習慣。圖4(c)是路徑3的轉化率,圖4(d)是路徑4的轉化率,均處于極低狀態,轉化率集中于0-0.1之間,究其原因為用戶對收藏商品的偏好遠低于加購商品,且用戶極少直接通過瀏覽對商品進行支付。

      3.商品分析

      本節對11月-12月時間跨度下,對商品銷量、用戶瀏覽量、加購量、收藏量進行分析,從而了解各個商品及商品類型對客戶瀏覽、加購、收藏等操作的影響。結果如圖5所示。

      圖5(a)為商品加購量前20,圖5(b)為商品瀏覽量前20,圖5(c)為商品收藏量前20,圖5(d)為商品購買量前20,經過對比,并不存在商品同時處于瀏覽、加購、收藏、購買前20中,瀏覽量第一與收藏量第一商品重合但該商品并未進入銷量前20,加購量第一也未能進入銷量前20商品中,局部而言,瀏覽商品前20中僅一件商品進入銷量前20商品列表中,收藏圖中無商品進入銷量前20商品列表中,加購商品共有五件商品進入銷量前20。

      122338823商品共計銷售出82件、123842164共計銷售出49件等可得,瀏覽會導致和收藏商品受用戶體驗感影響較強,但用戶熱衷于瀏覽和收藏的并不能代表用戶更愿意加購或支付該商品,即瀏覽量的高低與銷量的高低并無直接的強關聯。用戶存在大量上商品的購買并未進行大量操作,可見用戶直接購買商品占絕大多數,多數用戶生活存在剛需,該類商品具有支付時間短、瀏覽次數少、支付時間多的特點。

      四、總結

      人類日常生活生產活動產生了大量行為數據。隨著信息化的發展與普及,越來越多的人在網上購物,產生了大量電商行為數據。這些數據中包含了人類在購物時的行為模式、購物規律等,在行為研究、模式挖掘等領域有很大的研究價值?;诎⒗镌铺斐氐奶詫氂脩粜袨閿祿?,本文中通過三個維度分析數據,分別通過時間維度分析發現用戶高活躍狀態時間,通過分析用戶行為發現用戶對偏好商品的標記習慣與購買習慣間的關系,通過商品維度分析各操作下商品之間關系發現高銷產品特點,從而總結出了一系列淘寶用戶的行為模式與規律,對于相關研究具有一定的推動作用。然而,本文仍然存在一定的局限性,比如尚未對用戶購買商品間隔進行分析,我們在未來的工作會解決這些問題。

      參考文獻:

      [1]劉珊,蔡明月,劉興.淘寶文化產業數據的可視化研究[J].科教文匯,2018(19):183-185.DOI:10.16871/j.cnki.kjwha.2018.07.079.

      [2]Zoratti S,Gallagher L.Precision Marketing:Maximizing Revenue Through Relevance[M].Kogan Page,2012.

      [3]陳燁,王樂,陳天雨,等.基于社會網絡分析的社會化問答平臺用戶畫像研究[J].情報學報,2021,40(4):414-423.DOI:10.3772/j.issn.1000-0135.2021.04.008.

      [4]Kennedy D S.The Ultimate Marketing Plan:Target Your Audience!Get Out Your Message!Build Your Brand![M].Adams Media,2014.

      [5]MUELLER J,STUMME G.Gender inference using statistical name characteristics in twitter[EB/OL].(2016-6-17)[2018-3-01].https://arxiv.org/abs/1606.05467.

      [6]阿里云天池-淘寶用戶行為數據集.https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1.

      作者簡介:費千笑(2000.09- ),女,漢族,四川成都人,本科在讀,研究方向:金融數據分析

      猜你喜歡
      電商
      《2020年(上)中國新三板掛牌電商公司數據報告》發布
      再看電商發展的時與勢
      社交電商,春天來了?
      備戰雙十一
      2016年“電商百佳縣”TOP20
      固始縣舉辦團干部電商知識培訓會
      汽車電商生態:盈利之考
      電商的縮命
      大型電商十大熱賣玩具排行榜
      大型電商十大熱賣玩具排行榜
      两个人日本高清,夜色阁亚洲一区二区三区,亚洲 欧美 日韩 国产 高清
        <noframes id="fpxfr"><listing id="fpxfr"><listing id="fpxfr"></listing></listing>

          <address id="fpxfr"></address>

          <address id="fpxfr"><th id="fpxfr"><progress id="fpxfr"></progress></th></address>