• <input id="6aeuc"><u id="6aeuc"></u></input><nav id="6aeuc"><strong id="6aeuc"></strong></nav>
  • <nav id="6aeuc"></nav>
    歡迎訪問本網站!搜索學校主頁
    寒冬被裁,看小白如何逆襲拿名廠推薦策略Offer
    日期:2020-05-07 00:00:00  發布人:admin  瀏覽量:1

    18年末19年初的北京寒冷異常,網上說是近十年來最冷的冬天。與此相映的,是互聯網行業的情況。但酷寒并不能澆滅每個有夢想的互聯網人心中的光亮。

    18年初小諾因沒有機會做到熱愛的核心策略,離開了那家他心愛的搜索大廠和搜索引擎后,去一家生鮮獨角獸公司做數據可視化工作。一年后的19年初,小諾所在部門被新來的一幫人替換,所謂一朝天子一朝臣,原來的人都陸續離開了。

    小諾呢,一直想往搜索/推薦策略發展,但做策略的起點和要求比較高,小諾沒有經驗。而數據pm因為現在缺口較大,所以一年經驗也有很多機會。他不停的糾結,最后決定數據和策略都準備都投,有機會就去面試。

    如果策略的實在進不去,就還做數據先生存再追求理想,畢竟生活是曲折前進的,有時我們需要“曲線救國”。

    他讀了一些書籍,《數據產品經理修煉手冊》《數據產品設計》《數據產品經理》《走進搜索引擎》《推薦系統實踐》等,為面試做準備。

    hi,大家好,這里是暴躁策略信徒——小諾。

    很多朋友跟小諾說:

    我看它的jd(職位描述)上啥都沒說明白,我怎么準備面試???”

    我要轉方向做xx產品經理,可我沒經驗人家不要我,這可咋整???”

    我學校普通,大廠卡我學歷,腦袋嗡嗡的……”

    今天我們不講面試的理論,就拿個實際經歷來說吧~

    本文分十個部分。分別是:

    引言(蝦扯蛋)

    一、崗位分析和試前準備

    二、埋點設計數據采集

    三、數據倉庫數據存儲

    四、數據指標體系

    五、標簽和特征屬性

    六、推薦策略和算法

    七、AB測試實驗設計和策略效果

    八、運營分析和迭代

    結語

    上篇引言

    首先,咳咳咳……老規矩,先扯會淡……

    有天晚上小諾接到了遠在大連讀書的表弟小敏的電話,接起電話,他說“哥,你能幫幫我嗎?(b站裝機猿原味,不懂請自行百度)”

    小諾“不幫!”

    小敏“哥,是這么回事。我下午和同學去參加一個金融公司的面試,遇到一個我們學校的妹子,她先面試完事走的。我面試完一查那公司。

    才發現這公司半年前因為ffjz被政府通告了。我得找到那妹子告訴她,怕她被騙了。你能幫幫我嗎?”

    小諾“不能,找不到,我洗澡去了?!?/p>

    小敏“哥,大神,大佬,BAT的希望!幫幫我唄?!?/p>

    小諾“咳咳,你那是想幫她嗎,我都不好意思點破你!來說說你知道她什么信息?!?/p>

    小敏“我聽到面試官叫她王二丫?!?/p>

    小諾“你有全校名單沒,我記得你是學工部學生助理吧?!?/p>

    小敏“有的有的,最近6屆的都有,但只有班級姓名,沒有聯系方式?!?/p>

    小諾“沒關系,學校本科大四??拼笕拍苷夜ぷ?,所以你在15,16級的名單里面搜索她名字的拼音??纯从袥]有重名?!?/p>

    小敏“好的!哥,我看了,沒有重名?!?/p>

    小諾“很好,看看她是什么專業班級的?!?/p>

    小敏“日語軟件15002?!?/p>

    小諾“咱們學校的班級都有用qq群,你用這個做關鍵詞前面加學校簡稱搜索一下,看能不能找到,日語軟件四個字可以取兩個字搜索?!?/p>

    小敏“哥!我搜到了!好激動?!?/p>

    小諾“先別高興,他們班級群外人肯定加不上?!?/p>

    小敏“還真是,哥你料事如神?!?/p>

    小諾“快別拍馬屁了,你找他們群主,加一下,加的時候說你是同校什么專業的xxx?!?/p>

    小敏“好的!加上了呢!”

    小諾“你把事情簡單和對方說一下,問她班里是不是有王二丫,再請她幫忙轉告?!?/p>

    小敏“妥了!謝我英俊瀟灑,風流倜儻,多才多藝……的哥!”

    小諾“滾吧滾吧……”

    一、崗位分析和試前準備

    那么上面的故事和下面的面試準備有啥關系呢,我們接著往下看。

    有一天,小諾看到一個做新聞資訊的半傳統十八線知名互聯網新媒體公司,在招“畫像和推薦策略產品經理”。以下是崗位描述。

    工作職責

    1.負責內部數據平臺的產品建設,需求梳理,迭代推進和口徑梳理;

    2.負責新聞客戶端用戶分類畫像體系研究和搭建,優化內容標簽和個性化推薦策略;

    3.基于數據分析和數據邏輯,驅動產品和業務發展。

    注意:以下看到的均是做策略之前且是面試前的準備,也就是說在完全沒有實踐經驗前,通過知識儲備去分析的準備。雖然后期發現有很多和實際有些出入的地方,但我并為再優化,為的是讓讀者了解如何為跨入一個新的產品方向做準備。

    通過這個jd我們可以知道需要具備哪些方面的知識。列舉一下:

    數據方面:數據埋點和采集,數據倉庫和存儲,數據指標體系設計,數據可視化,數據分析和運營。

    畫像和推薦:用戶分類體系設計,用戶畫像,推薦策略和算法。

    產品經理:基本素養。

    大概需要以上這些方面的知識,我們不會全都去負責,但是各方面的知識都要懂,畢竟要看到森林也要看到樹木。

    面對如此多的方面我們應該如何去準備,需要我們先了解這個崗位要做的產品的目標。這個產品是一個新聞app客戶端。它有新聞,視頻,廣場,我這四大模塊??梢詾g覽或者聽新聞,視頻,直播,fm,小說,文章,還具有很淺的社交功能。

    這個崗位的主要職責是構建和優化用戶和內容標簽體系,同時優化個性化推薦策略。

    我們整理下需要學習的知識:

    其實到這里我們發現,針對面試的分析準備,就和引言的故事一樣,從已知的信息出發,一點點分析,一點點準備,串成鏈路。

    作為一個小白,不懂就學,所以我們要對上面涉及到的所有知識進行學習,但第二天就要面試,一天時間掌握大量知識不太現實。我們產品最擅長的就是定需求的優先級,那么根據崗位的核心要求,我們先了解畫像推薦和策略的知識,再看數據的知識。

    因為熱愛搜索和推薦,在此之前小諾看了很多文章和書籍,已經有了一些知識儲備,只是沒有去考慮過在一個新聞app上如何實踐,所以他需要的是把儲備的知識鏈路打通。按照上面列的鏈條去把每一環搞明白。

    很多小白產品經理,總和小諾說:我看了一周的書,覺得收獲不大,看了一個月三個月書了,發現知識還是連不起來,我是不是不適合做產品。其實不是這樣的,知識積累是一個長期的過程,小諾深深的記得,剛開始做產品的時候,每天通勤時間4小時,小諾會在地鐵上看書,但是半年了發現知識還是不成體系,但還是繼續堅持,直到一年后才慢慢有了思路,才能系統的去思考一個問題。

    二、埋點設計數據采集

    埋點方式

    一般來說,數據來源有產品上埋點獲得的用戶數據如uv和pv;有業務系統統計的數據如交易數據;有爬蟲從其他第三方平臺或網站爬取的數據;有手持終端獲得的數據等。

    這里需要做的是在app上設計埋點方案,當下埋點一般有三種方式:代碼埋點,可視化埋點,全埋點。每一種都有優缺點,代碼埋點比較靈活但費人工,全埋點需要較大的存儲成本但較全面。同時埋點也分為前端埋點和后端埋點,后端埋點指的是獲取在app上操作之外的數據,比如通過鏈接下載的數量。

    key-value方式

    了解得知此app目前用的是代碼埋點。在設計埋點方案時,獲取的指標要明確,層級要分明獨立。比如我從梁老師《數據產品經理修煉手冊》中學習的這種現下流行的埋點方式:key-value??梢园凑展δ?頁面-位置-操作的層級關系去確定。

    同時需要通過埋點獲得的指標數據應當是為目標服務的,即目的要明確,要結合業務邏輯、運營體系去設計埋點方案。最后埋點方案應該考慮復用性,避免應后期也許變動引起方案變化高強度增加研發的工作量。

    一般一個埋點方案可以包含以下題頭:功能,用戶行為,事件類型,事件id,key,value,描述,備注。

    事件類型分為:曝光事件,點擊事件,頁面事件。

    比如做ab測試時有A和B兩個活動頁面,每個頁面進去都有軍事和歷史兩個分類,我們要統計兩個分類的點擊事件。這里為了提高復用性可以采用樹狀結構,即事件id是“活動按鈕”,二叉樹分為“頁面”和“入口”,“頁面”的二叉樹分為“A頁面”和“B頁面”,“入口”的二叉樹分為“歷史”和“軍事”,這樣即使后期增減活動,也只需要增加或者刪除其中一部分分支。

    指標定義

    這里我們要明確需要統計的數據,會涉及到如何定義指標。

    定義指標時含義要準確,比如統計獨立用戶數時,是否包含訪客,如果包含,因為訪客沒有登錄,我們統計的就會是獨立設備數。

    再比如頁面訪問次數,如果同一個頁面刷新一次是否該統計。再比如下單金額要統計優惠前還是優惠后。

    如此精確就像是我們要統計的是”今天12點之后從樹上掉下來的方形的黃顏色的帶葉子的大蘋果”。

    三、數據倉庫數據存儲

    我們采集的數據可能會存在數據缺失,數據冗余等問題,需要經過數據清洗。比如缺失數據要考量是否可以補,冗余數據是否可以刪。還有數據的歸一化、離散化、無量綱處理等,這里不做詳細介紹,具體的可以百度查看相關文章。

    因為我們要從源頭保證數據質量,數據來了我們要放到數據倉庫里,數據倉庫會集成來自不同數據源的數據,且是面向主題的,比如根據公司業務線進行劃分。

    這里我們簡單說一下架構:

    最底下是采集存儲層:會有數據采集、容錯、解析引擎。數據會分成結構化、半結構化、非結構化的數據。這里還要用到集群協調,分布式存儲,高并發響應。

    再上去是數據計算層:分ods,bds,ids,分別是原始數據,基礎數據,指標數據。這里我們也要做對數據抽取,轉換,加載,包括了數據清洗。

    再上去是數據模型層:這里有許多分析模型,算法模型,還有標簽庫。

    再上去是數據服務層:這里可以是可視化平臺,可以包括指標數據,用戶畫像,標簽集合,數據報表等。

    再上面是數據訪問層:比如開放接口,數據庫查詢。

    四、數據指標體系

    指標組成

    我覺得指標是一個能夠定量反映事實的標準。

    一般指標由維度、定義和度量單位組成。維度就像是從不同角度劃分對象的定語,比如蘋果從顏色維度可以分紅黃綠,從形狀維度可以分方圓,從體積維度可以分大中小。度量單位就是一個指標的單位,比如“元”“個”“斤”。舉個例子:自營(維度)銷售額(定義)萬元(度量單位)。

    需求了解

    在搭建指標體系前我們需要先了解需求,了解業務。比如你的需求方是公司的營銷部門,他們需要看到會員用戶的一些指標,發現會員用戶的特點和現狀,通過數據來指導業務,針對性的做一些營銷活動或者拜訪回訪。

    那么我們需要了解會員機制,是需要消費夠一定金額,或者連續多少天下單才能成為會員,亦或是其他方式?成為會員后會不會在什么情況下失去會員身份?

    再考慮能夠反映會員用戶情況的指標有哪些,比如會員用戶比例及變化,會員用戶消費情況和普通用戶的比較,具體的指標需要我們和業務部門去共同商定。

    體系搭建

    對于指標體系的搭建,工作中需要根據公司業務情況分類,比如分成下單,倉儲,配送,客服,營銷等分類。

    同時在每個分類中,也應按照高優,區間,低優將指標分列。高優指標即指標數值越高越好;低優指標數值越低越好;區間的分固定和浮動,浮動的比如存儲溫度,在0-2攝氏度就是安全范圍,過高或者過低就需要預警;固定的需要固定在一個數值。

    對指標按照業務線或者其他方式分類有助于按照模塊構建指標體系,對指標按照高低目標分類有利于之后的可視化設計以及數值預警。

    五、標簽和特征屬性

    那么什么是標簽呢,我理解的標簽是為了定義出對象的特點,用一個個標簽讓對象的骨肉更加清晰,從而讀懂它。

    一般對于用戶畫像會從6個方面來進行,基本信息,興趣愛好,行為特點,消費信息,社交網絡,心理特征。

    標簽分類

    標簽在數倉中從下到上分為數據源,事實標簽,模型標簽,高級標簽。

    事實標簽也可以說是指標標簽,比如用戶瀏覽時長,各時段在線用戶數等。

    模型標簽比如用戶屬性,興趣愛好,內容偏好,活躍度等。

    高級標簽比如用戶分級,流失模型標簽。

    標簽結構

    我們為用戶或者內容打標簽是為了對其分類,以便更好的了解這個集合中對象的特點,從而針對性的做精細化的運營。也可為信息流推薦打好基礎。

    標簽體系分為結構化,半結構化,非結構化三種。

    結構化的標簽一二三級層級和所屬分明;

    半結構化的層級結構比較分明;

    非結構化的標簽體系諸如廣告推廣時設定的關鍵詞。

    標簽規則

    標簽的命名應該短小易懂,具有代表性,并且無歧義。

    標簽的體系設計應該做到標簽和標簽相互獨立,并且完全窮盡。

    同時標簽粒度也要有所把握,粒度太粗無法區分用戶,粒度太細集合樣本較少、太過于個性同時標簽體系也會太過龐大。

    對于此新聞app,在首頁它有幾種搜索途徑:有搜索框輸入關鍵詞主動搜索;有軍事科技歷史娛樂社會等的分類垂直搜索;有信息流個性化推薦;還有訂閱形式的推送。

    我認為它的標簽體系可以設立為“分類——主題——關鍵詞”的三級(多級)模式,同時關鍵詞可能要相對獨立。

    分類指的是“歷史,軍事,娛樂,社會,科技”等等這些;主題的話比如歷史分古代史近代史,也分中國史外國史;關鍵詞的話比如用戶愛看的是關于歷史-近代史-張學良的文章。

    結語

    今天小諾先講到這里,感謝大家關注!

    下期我們會講到大家最喜歡的:推薦策略和算法,ab測試和效果評測,運營分析迭代。

    下期的引言還會帶來我曾在搜狗一面遇到的邏輯推理題。

    最后我想說,都說互聯網遇到了寒冬。如果你是有多年經驗的老產品,請你像看到過去的自己那樣幫助新人。如果你是四處碰壁的新產品,請你在歷經坎坷時也別忘記最初的夢想。

    hi,大家好,這里是有溫度的pm——小諾。

    今天我來為大家講述那場面試準備的后半部分,同時也會簡單講述那場面試的經過。

    下篇包括:

    引言

    六、推薦策略和算法

    七、AB測試實驗設計和策略效果

    八、數據指標、標簽可視化

    九、運營分析與迭代

    十、面試經過

    結語

    ?

    ?

    ?

    下篇引言

    首先我們來看三道邏輯推理題,這是18年我參加x狗搜索產品pm面試時,一面的筆試題。

    1.屋外三個開關控制三個燈,只有進屋才能看到燈泡亮滅情況,如何只進屋一次,確定開關控制情況。

    2.兩個10升的試瓶中分別盛裝了5升藍墨水與紅墨水。用一個5毫升的勺從紅墨水試瓶中舀出5毫升的紅墨水,將其到入到藍墨水試瓶中,攪拌后再出藍墨水試瓶中舀出5毫升的墨水,將其到入到紅墨水試瓶中。問:紅墨水試瓶含藍墨水多,還是藍墨水試瓶含紅墨水多?

    3.有3頂紅帽子,2頂黃帽子。測試人員共3位。裁判讓3個人從矮到高縱向站成一一隊,給他們每個人頭上戴一頂帽子。

    每個人都看不見自己戴的帽子的顏色,卻只能看見站在前面那些人的帽子顏色。

    裁判問最后一位:“你是否知道自己帶的帽子的顏色?”回答:“不知道”。

    然后問中間這位同樣問題,回答仍然是不知道。

    最后問最前面的那位,這位說:“知道”。

    (注:所有的問答,3位測試人員都能聽見)

    問:最前面這位所帶帽子顏色是什么,為什么?

    機智的你,來解答一下唄,歡迎在留言區評論~

    六、推薦策略和算法

    當我們有了標簽體系,采集到了用戶的數據,我們要從這些數據中“讀”出有用信息從而為用戶打上標簽,這里會涉及到數據挖掘,自然語言處理,語義理解,機器學習等技術。

    分詞方法

    比如一個用戶看了一篇新聞發表了一個評論,我們想要了解他說了什么,提取出對我們有用的信息。

    這里就涉及到了分詞技術,比如“如果真是計算機就好了”這句話。說幾種比較簡單的分詞方法,比如按照字典分詞,字典通常采用前綴樹或者后綴樹的數據結構存儲,進行正向最大匹配。以上面的為例“如”后跟“果”,“如果”是一個詞語,再看第三個字“如果真”不是一個詞,繼續向下,發現都不是一個詞組,那么就在“如果”這里進行切分?!坝嬎恪笔且粋€詞,繼續向下“計算機”也是一個詞語,“計算機就”不是一個詞語,再往下發現到最后依然組不成詞組,那么在“計算機”這里切分。

    以上句子存在的交集型歧義也需要解決,“如果”和“果真”都是詞語,語義理解時計算機語言讀懂句子用到的是“如果”而不是“果真”。這里還有一種分詞方法是基于統計的分詞方法,即我們常說的貝葉斯分詞,即通過大量語料積累進行機器學習,統計出一個字后面跟另一個字的概率,從而進行分詞。

    語義理解

    語義理解中還要進行情感的理解,以及邏輯推理。情感理解,舉個例子,如果是在ota上定了一個旅店,住了一晚然后給出了評價,比較明顯的情感評價是“環境太好了”“熱水器真糟糕”。

    不易發現的情感如“提供了早餐”,其實我們可以看出提供早餐是用戶的褒義評價,但可能一般的算法讀不出來。

    再比如如果網購的地址填寫的是學生宿舍,那么算法也需要大量學習,進行推理,從收貨地址是學生宿舍推理出用戶是學生,這就像百度的知識圖譜。

    用戶畫像

    接下來我想聊一下用戶畫像的幾個分類,比如基本信息,如姓名,性別,年齡,生日,星座,設備號,職業,學歷,手機號,郵箱等。這類特征是可以長時間不進行更新的,比較固定。

    但對于這個新聞app有個問題,比如對于社交軟件,用戶樂于填寫個人信息,但對于新聞app,可能100人,有30個人填寫了信息,另外70個人不去填寫。這里我們為了給這70個用戶打標簽,就需要用這30個人做為樣本集,進行學習。比如通過學習,了解男性用戶和女性用戶的特點有什么不同,比如男性用戶早晨更喜歡看時事新聞,晚上喜歡看玄幻小說,女性用戶早上喜歡看娛樂熱點,晚上喜歡看言情小說。通過得出的這些特征,進行“標簽擴散”,為那70個未填寫性別信息的用戶打上性別標簽。

    接下來我們說一下興趣愛好和行為特征,這類標簽是經常變化的,具有時期時效性。比如我們為了知道一個用戶對哪類新聞感興趣,設計了一個打分加權模型,每點一個分類的新聞就加一分,線性增長。比如用戶30天點了156次軍事新聞,就156分,點了45次歷史文章歷史就是45分,我們可以看出用戶最喜歡看的是軍事,其次是歷史。于是我們主要給他推薦軍事,其次是歷史。

    但這里有個問題,如果某一天開始,用戶開始對娛樂新聞感興趣了,即他目前更想看的是娛樂新聞,但因為歷史數據積累軍事新聞權重太高,短期內算法無法推送娛樂新聞給他,那么線性打分模型是不合適的。

    我想這里可以采用指數模型,比如對某個類別的興趣權重滿分是10分,前9次每次1分,第10次開始每次在之前基礎上,加9*10的-(n-9)次方,第10次就是9.9,第11次點擊軍事就是9.99,以此類推,讓權重不斷逼近10。當然我們還要通過其他特征調整權重,比如打開頻率,如三天看1次軍事的,還是一小時看3次軍事的。這樣當用戶開始對新的類別感興趣的時候,可以更快的得到推薦。

    常用算法

    這里我們來說一下推薦算法。首先我們會把用戶和新聞分別標簽化,來講一下協同。

    比如甲用戶喜歡軍事和娛樂,乙用戶喜歡科技和文學。甲乙用戶標簽化后相似度很高,達到了一定閾值,那么我們可以認為乙用戶喜歡的分類,甲用戶可能也喜歡,于是我們把科技和文學推薦給了甲用戶。這是基于用戶的協同。

    如果甲喜歡a文章,a和b文章標簽化后相似度很高,那么我們猜測甲也會喜歡b文章。

    如果有甲乙丙三個用戶,甲乙喜歡a文章也會喜歡b文章,丙喜歡a文章,那么我們根據“所有喜歡a文章的用戶都會喜歡b文章”可以猜測丙用戶也會喜歡b文章。

    基于相似度的推薦涉及到一個公式,這個公式來源于搜索引擎,因為搜索引擎的查詢系統要根據用戶輸入的關鍵詞對抓取到的網頁按照相關度進行排序,從而展現在用戶面前。這個模型就是向量空間模型,余弦相似度公式。

    我們給用戶打上不同的標簽,分配不同的權重,比如abc三個標簽,權重分別是λ1λ2λ3。每個標簽量化到一個坐標軸,這樣我們在一個三維坐標系可以唯一確定一個向量。同時我們把眾多的新聞也進行向量化,得出和用戶標簽向量的相似度,推薦排序按照相似度從高到底排序。就實現了推薦。

    但這里也會有一些常見問題,比如如果我們標簽打的很多,也就是向量維度很多,其中有一些維度就因為數據空白太多而影響準確性。比如如果“轉發”是一個維度,100個用戶只有5個人轉發,那么在轉發這個維度上只有5個人有數值,其他95個人此維度就會被置為空,如果這種維度過多,就影響相似度計算。

    面對這樣的情況,我認為是否可以把這樣的標簽不單獨設置維度,而是以加權的形式加到前面維度的權重上,從而解決這個問題。

    一些思考

    這里還有一個問題在于,比如還是在旅店,甲旅店評價標簽是環境好5分,設施齊全5分,有早餐3分。乙旅店環境好5分,設施齊全5分。我們顯然知道甲旅店更好一些,因為甲旅店還提供早餐,雖然不是5分滿分,但多了一個服務。但是如果按照打分模型給標簽分配不同的權重,因為早餐這個標簽甲旅店不是5分滿分,所以總評分反而沒有乙旅店高。會存在這樣的例子,所以甲乙旅店標簽可能需要進行統一化。

    最后我們來說一下地理信息,比如我的常駐地是北京,app每天給我推薦北京本地的新聞,有天我去威海旅游了,那么app本地新聞的版塊應當做到靈敏反應。

    再來談一下高級標簽的模型搭建,比如用戶流失模型,是一天登一次,三天登一次,一周不登一次,一個月不登一次等等,劃分abcd等流失級別。以及活躍度等標簽。這種模型更常見的是天氣預報app,里面的穿衣指數,洗車指數就通過構建模型建立。

    七、AB測試實驗設計和策略效果

    ab測試

    當我們設計了一個策略方案,我們需要分組來測試效果。

    比如我們針對通勤場景,從用戶角度出發,感覺在有線環境下,與無線環境相比,用戶更少點擊視頻或者純圖的資訊。

    因此我們提出假設,設計策略,即在有線環境下,減少信息流上視頻和純圖資訊的比例。

    將同質用戶分組,控制唯一變量,對照組為目前情況,實驗組幾組分別在有線情況下,減少視頻和純圖資訊30%,40%,50%,60%,70%。

    同時我們要多加一組和對照組相同的組,進行aa測試,以保證沒有其他因素帶來自然波動。后期看數據時方便查看。

    效果思考

    我們設計好了標簽體系,為用戶進行了畫像,還做了新聞推薦,那么我們的標簽打的如何呢?需要進行評估,評估的話就涉及到了量化的指標。

    比如我們在一批同質同標簽用戶中,給其中一部分推送他們喜愛的新聞。我們來看他們的點擊次數和瀏覽時長是否相對另一組用戶要大。如果大,可能我們的標簽體系就建設的不錯。

    分析思考

    如果一個用戶我們判定他喜愛娛樂-國內-xx明星,我們推送了這個明星的另一篇報道給他。他點進去沒怎么看就出來了,這一定是我們標簽打錯了嗎?

    我認為不一定,可能他前面看的文章和推薦文章內容相似,也可能前面看的文章內容篇幅高度文筆都高于后一篇。那么如果我們推薦一篇和他看過的文章內容不同,質量相當的他感興趣的明星的文章,他依然點進去就出來,會是什么原因呢?我認為可能會是觀點相反,比如第一篇文章是褒獎此明星的,推薦的是抨擊該明星的,所以用戶跳出。

    這里我認為文章應該有分級機制,比如分一類二類三類,我從面試官處了解到公司確實有。我繼續問比如同一篇文章是否只有一個通用級別,還是說它是軍事一類,同時屬于歷史三類文章。面試官說是通用的,還沒有細分。

    同時這里也會有個問題,就是沒有作者喜歡自己的文章被分級,而是喜歡讓更多的用戶看到。

    還有目前在內容標簽體系中也會存在內容交叉的問題,比如軍事下面的歷史和歷史下面的軍事,這也是需要解決的問題。

    同時關于內容標簽體系的建立,我認為像我開始說到的,關鍵詞提取和標簽體系分開。結構化標簽和非結構化標簽合作。

    提取文中能代表本文內容的關鍵詞,這里我來說一下搜索引擎中的一個tf-idf加權技術,這個技術說的是,如果一個詞語再本文中出現的越多,在其他文章中出現的越少,則這個詞語具有很好的代表性。tf是這個詞語在本文中出現的頻率,比如分詞后本文有100個詞,產品經理出現了5次,則5/100得到的0.05就是詞頻。

    我認為內容標簽關鍵詞體系的設計,除了產品,算法,同時也需要運營支持,采用機器+人工的方式。

    八、數據指標、標簽可視化

    上面有談到數據指標體系建設,按照業務線分開,按照高低優區間分開。

    接下來應當按照查看要求,用合適的圖形繪制,比如如果是看數據的趨勢可以用點線圖,如果要看數據占比可以用扇形圖,如果要看數據離散程度同時為數據擬合做基礎,可以用散點圖。我們把每個需要的指標圖形繪制出來。

    然后我們需要了解業務上的目標或者我們的目的,再按照用戶的業務邏輯或者分析邏輯進行組合。

    比如負責vip商戶的部門想看上個月每個城市vip商戶的銷售額和毛利。我們可以用柱狀圖橫向列出各城市的銷售額和毛利,上面用扇形圖集合分布展示,比如用扇形圖的面積代表銷售額,面積越大銷售額越大,用顏色深淺代表毛利的大小,顏色越深毛利越多。

    如果a和b兩個城市扇形圖面積差不多大,但是a城顏色更深,那么我們需要進一步分析a城毛利高的原因,從而指導b城盈利。于是我們下鉆到下層頁面,下層頁面可以具體顯示ab兩城米面糧油四個品類的毛利,我們舉例簡單點,比如通過對照,發現米面糧ab兩城毛利差不多,油這個品類a明顯高于b,那么業務人員可以定位到是那個品類的問題,再從也許場景去找到根本原因。

    關于指標和標簽我認為應該根據實際情況組合或者分開設計。比如可以把報表,圖形,運營工具,標簽畫像,接口分開。

    當我們的原型圖設計好后可以找需求方確認,并邀請研發,業務一起開評審會,確認沒問題后開發測試上線。

    從本質上來說做產品的過程都是發現問題——分析問題——給出方案——落實方案——評估迭代。

    但數據產品經理和其他產品經理還是有些區別的,比如一般的產品可能更注重交互,頁面美觀度,用戶感知等。但數據產品更注重邏輯。再比如普通產品如果有問題或者bug如果不是特別緊急可以放在下一版本解決,但是數據產品一旦有問題,需要立刻解決從而保證數據準確性。

    但無論如何我們都要考慮,用戶是誰,他們有什么特點,產品價值有多大,目前的滿足程度。同時考慮成本與收益的關系,比如考慮人力成本,資源成本,沉沒成本,用戶成本等。

    當產品開發后,我們可以先為部分用戶開放權限進行內測,比如跑一周的數據如果沒有問題再進行公測。同時這里應該也要做好用戶權限的設計管控,可以把用戶崗位職級——系統模塊角色——具體模塊三者聯系起來,讓不同部門不同職級不同職責的用戶看到不同的內容。

    如果有數據質疑需要排查??梢苑譃槿?對口徑,查代碼,導明細。

    比如一個業務人員說在業務系統看到a指標的數值和bi系統上的不一樣。那么我們首先要確定數據源和指標口徑統計方式是否相同。一般第一步可以解決絕大多數的問題。

    如果第一步不行,我們可以叫兩個系統的研發對代碼,看是否代碼有問題,是否用的不是一個數據表。

    如果第二步依然不行,我們可以導出兩個系統指標的明細數據進行核查。

    九、運營分析與迭代

    在運營中我們可能需要通過分析來發現問題。比如可以通過指標邏輯,比如看到銷售額暴跌,影響銷售額的子指標是下單商戶數和客單價,然后再分析這倆指標,按照指標邏輯看看哪里出了問題。

    也可以按照aarrr模型(獲取,激活,留存,支付,分享)或者漏斗模型(訪問,抵達,瀏覽,咨詢,收藏,下單,支付)或者用戶操作路徑等模型一個個環節分析。

    還可以按照業務場景分析,比如采購,運送,倉儲,分揀,配送,售后等環節一步步分析。

    再比如有個問題,說一家商場中每天的總營業額都差不多,某一天其中一家商店的營業額驟降,商場總得營業額還是差不多。

    那么我們首先應該了解這個商店往日占到商場總營業額的比例,如果比例較高,則表示可能客戶流失到其他商店,所以導致商場營業額不變而此商店驟降。

    如果此商店比例較小,不對商場有什么影響。那么我們考慮內外部因素,外部因素比如受到某個事件影響。

    內部因素可從客戶體驗流程分析,比如商店是否裝修,服務是否降低,貨品是否過期或缺失,價格是否升高等等。

    問題都需要在運營中發現,用戶的增長也需要運營去針對性的做精細化運營。

    十、面試經過

    那日下午,我去參加面試,那是我第一次應試策略崗位,面試官是個很年輕的大哥,后來成了我的領導,入職后才知道他也是從那家搜索大廠出來的。

    面試開始,他先讓我做自我介紹,再介紹下以往的經歷和做過的項目。然后問到我在那家搜索大廠的經歷,雖然當時我做的不是核心策略,但是懂很多的策略知識,我當時也寫在了簡歷上。他覺得我的經歷不是很匹配,但看到我簡歷上所寫,就讓我說說自己知道的知識,以及如果讓我做新聞資訊的畫像和推薦我要怎么做。簡而言之,就是做一場產品思路的陳述。

    我覺得這是個機會,就把前文中提前學到的知識,串起來在面試官面前一步步講解,說出自己的思考和想法。后來面試官問了幾個發散的問題。持續了一個小時,再后來涉及到了算法,于是喊了算法工程師來面我,

    算法工程師問了我對一些算法的基礎了解,以及說出一些算法面臨的問題該如何調優,讓我發散性的考慮下,我做了陳述。又過了半小時,就是hr的面試。一周后我收到了offer。

    對于這次經歷,我總結一下吧。我是個普通高校的畢業生,因為大廠對做策略的門檻比較高,要么有經驗,要么本科985 211或者碩士畢業,所以之前我會被一些大廠卡。

    當決定一定要向自己熱愛的策略努力的時候,我先自己買書學習,在網站上看文章學習,然后做筆記,每次面試前都會過一遍筆記,直到自己可以把那些內容背出來。我也買了一塊白板,當自己的一塊知識有了架構后,給我做研發的朋友試講一次,讓他也能聽懂。表示我掌握了。

    我深知策略需要很強的實踐,只有實踐才能有經驗,那些策略的結果和數據,不是看書或者想象就能得到的。但在沒有入行之前,我們唯有不停的學習,拓展知識面,擴充知識儲備。等待每一次面試機會的來臨。

    入職后,我的老板也挺喜歡我,帶我一起做了一些策略,我終于轉方向成功了。

    以上全部就是我這次面試的經過和所做的準備,希望對大家有用。

    結語

    春已至,生活雖是曲折前進的,但每個追求夢想的產品人,都在深情的堅持著。

    我走過很多路,才有機會和滿是碩士海龜的同事們坐在一起辦公。

    我相信執著過才知道機會的難能可貴,祝大家都能做到自己喜歡的方向。

    核發:0 點擊數:1 收藏本頁
    分享到
    相關鏈接
    我是不是比你老公厉害
  • <input id="6aeuc"><u id="6aeuc"></u></input><nav id="6aeuc"><strong id="6aeuc"></strong></nav>
  • <nav id="6aeuc"></nav>