基于機器學(xué)習(xí)的軟件工程與圖像視頻分析的新問題、新方法研究ppt_第1頁
已閱讀1頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、基于機器學(xué)習(xí)的軟件工程與圖像視頻分析的新問題、新方法研究,報告人:荊曉遠(yuǎn) jingxy_2000@126.com,Pattern Recognition And Software Engineering,Machine Learning and its Aplication Laboratory,http://mla.whu.edu.cn/,http://coa.njupt.edu.cn/prase/,,,,,1,,近期工作介紹

2、,,Outline,,,,,,,,,基于機器學(xué)習(xí)的軟件工程技術(shù)研究,,,1-1,近期工作介紹: 軟件工程方向,軟件工程方向聚焦于軟件缺陷預(yù)測、軟件工作量估計技術(shù)。,軟件缺陷預(yù)測:Dictionary Learning based Software Defect Prediction, International Conference on Software Engineering (ICSE), 2014【他引40次,成功地將字典學(xué)習(xí)

3、技術(shù)用于低維的缺陷數(shù)據(jù)分類】Heterogeneous Cross-company Defect Prediction by Unified Metric Representation and CCA-based Transfer Learning, ACM Conference on Foundation of Software Engineering (FSE), 2015【他引33次,與香港科技大學(xué)計算機系研究組同時發(fā)現(xiàn)異質(zhì)缺陷

4、預(yù)測問題】An Improved SDA based Defect Prediction Framework for both Within-project and Cross-project Class-imbalance Problems, IEEE Transactions on Software Engineering (TSE), 2017. 【該論文應(yīng)邀在ICSE 2017上做Journal First Paper(期刊精

5、選論文)報告】On the Multiple Sources and Privacy Preservation Issues for Heterogeneous Defect Prediction,IEEE Transactions on Software Engineering (TSE), 2018, 在線出版. 【被評價為這一方向上目前最好的結(jié)果】Cross-Project and Within-Project Semisup

6、ervised Software Defect Prediction: A Unified Approach, IEEE Transactions on Reliability (TR), 2018.以及CCF的B類期刊ASE、IST、STVR、IET Software和B類會議ICSME等。,,,1-1,近期工作介紹: 軟件工程方向,軟件工作量估計:1. Missing Data Imputation Based on Low-r

7、ank Recovery and Semi-supervised Regression for Software Effort Estimation, International Conference on Software Engineering (ICSE), 2016. 【首次提出缺 失工作量數(shù)據(jù)補償問題,被評價為當(dāng)時最好的結(jié)果、里程碑的工作】2. Privacy Preserving via Interval

8、 Covering Based Subclass Division and Manifold Learning Based Bi-directional Obfuscation for Effort Estimation, IEEE/ACM Conference on Automated Software Engineering (ASE), 2016. 【首次提出工作量估計的隱私保護(hù)問題 】3. Software

9、Effort Estimation Based on Open Source Projects: Case Study of Github, Information and Software Technology (IST), 2017.4. Online Software Effort Estimation, ICSE短文錄用, 2018.,軟件工程方向聚焦于軟件缺陷預(yù)測、軟件工作量估計技術(shù)。,,,1-2,近期工作介紹: 圖

10、像視頻分析方向,圖像視頻分析方向聚焦于行人重識別、高維數(shù)據(jù)特征提取技術(shù)。,行人重識別:Super-resolution Person Re-identification with Semi-coupled Low-rank Discriminant Dictionary Learning, CVPR, 2015 / IEEE Transactions on Image Processing (TIP), 2017. 【他引52次,首次

11、提出超分辨率行人重識別問題】Video-Based Person Re-Identification by Simultaneously Learning Intra-Video and Inter-Video Distance Metrics, IJCAI, 2016 / IEEE Transactions on Image Processing (TIP), 2018.Learning Heterogeneous Di

12、ctionary Pair with Feature Projection Matrix for Pedestrian Video Retrieval via Single Query Image, AAAI, 2017. 【首次提出圖像視頻行人重識別問題】Image to Video Person Re-identification by Learning Heterogeneous Dictionary Pair with Fea

13、ture Projection Matrix, IEEE Transactions on Information Forensics and Security (TIFS), 2018. Semi-supervised Cross-view Projection-based Dictionary Learning for Video-based Person Re-identification, IEEE Transactions o

14、n Circuits and Systems for Video Technology (TCSVT), 2017. 【首次提出半監(jiān)督視頻行人重識別問題 】,,,1-2,近期工作介紹: 圖像視頻分析方向,圖像視頻分析方向聚焦于行人重識別、高維數(shù)據(jù)特征提取技術(shù)。,高維數(shù)據(jù)特征提取和學(xué)習(xí)(特別是多源異構(gòu)大數(shù)據(jù)分析,發(fā)展了多視圖學(xué)習(xí)技術(shù)):Semi-supervised Multi-view Correlation Feature Lear

15、ning with Application to Webpage Classification, AAAI, 2017. 【在多視圖、多光譜、多模態(tài)特征學(xué)習(xí)方面發(fā)表了系列研究論文】Multi-kernel Low-rank Dictionary Pair Learning for Multiple Features based Image Classification, AAAI, 2017. Discriminant Tensor

16、 Dictionary Learning with Neighbor Uncorrelation for Image Set Based Classification, IJCAI, 2017.Multiset Feature Learning for Highly Imbalanced Data Classification, AAAI, 2017. Multi-Label Dictionary Learnin

17、g for Image Annotation. IEEE Transactions on Image Processing, 2016.Multi-view Low-rank Dictionary Learning for Image Classification, Pattern Recognition, 2016.Multi-spectral Low-rank Structured Dictionary Learning for

18、 Face Recognition, Pattern Recognition, 2016.Uncorrelated Multi-set Feature Learning for Color Face Recognition, Pattern Recognition, 2016.Intra-View and Inter-View Supervised Correlation Analysis for Multi-View Featur

19、e Learning, AAAI, 2014.Uncorrelated Multi-View Discrimination Dictionary Learning for Recognition, AAAI, 2014.,,,,,2,,近期工作介紹,,Outline,,,,,,,基于機器學(xué)習(xí)的軟件工程技術(shù)研究,,,不同的軟件模塊之間存在一定相似性,即一個軟件模塊可以由少量的其他模塊近似地表示,近年來,很多流行的機器學(xué)習(xí)分類方法在軟件缺

20、陷預(yù)測領(lǐng)域都得到了應(yīng)用。但是,這些分類方法通常會面臨一些困難,例如類不平衡(class-imbalance)問題和誤分類代價(misclassification cost)問題。,稀疏表示、字典學(xué)習(xí)是圖像視頻高維數(shù)據(jù)分析熱點技術(shù),能否適用于低維度量表示的軟件缺陷數(shù)據(jù)?,,能否通過構(gòu)建軟件缺陷數(shù)據(jù)的稀疏表示解決預(yù)測過程中遇到的問題?,軟件缺陷預(yù)測,●基于字典學(xué)習(xí)的軟件缺陷預(yù)測,2-1,Xiao-Yuan Jing, Shi Ying, Z

21、hi-Wu Zhang, Shanshan Wu, Jin Liu: Dictionary learning based software defect prediction. ICSE, 2014.,,,我們第一次嘗試在軟件缺陷預(yù)測領(lǐng)域應(yīng)用字典學(xué)習(xí)技術(shù),通過軟件度量特征挖掘,學(xué)習(xí)多字典和特征表示系數(shù)。為了增強模型分類能力:,軟件缺陷預(yù)測,2-1,Xiao-Yuan Jing, Shi Ying, Zhi-Wu Zhang, Sh

22、anshan Wu, Jin Liu: Dictionary learning based software defect prediction. ICSE, 2014.,,,軟件缺陷預(yù)測流程,實驗在來自于NASA的10個數(shù)據(jù)集上,與幾種最具有代表性的軟件缺陷預(yù)測方法進(jìn)行了對比,取得了較好的預(yù)測結(jié)果。,提出了一種代價敏感,具有判別力的字典學(xué)習(xí)(cost-sensitive discriminative dictionary learni

23、ng,CDDL)方法,Xiao-Yuan Jing, Shi Ying, Zhi-Wu Zhang, Shanshan Wu, Jin Liu: Dictionary learning based software defect prediction. ICSE, 2014.,軟件缺陷預(yù)測,2-1,,,類不平衡問題(class imbalance),,項目內(nèi)(within-project):數(shù)據(jù)類的不平衡分布導(dǎo)致了缺陷預(yù)測的準(zhǔn)確率較低

24、。,,跨項目(cross-project):現(xiàn)有的處理跨項目類不平衡的缺陷預(yù)測方法中,在欠采樣和過采樣的進(jìn)程中會伴隨原始信息的丟失以及綜合信息的加入。,怎樣設(shè)計一種通用方法同時解決項目內(nèi)與跨項目中的類不平衡問題?,,軟件缺陷預(yù)測,Xiao-Yuan Jing, Fei Wu, Xiwei Dong, Baowen Xu: An Improved SDA Based Defect Prediction Framework for Bot

25、h Within-Project and Cross-Project Class Imbalance Problems. TSE, 2017.,●基于改進(jìn)子類判別分析的缺陷預(yù)測框架用于項目內(nèi)與跨項目中的類不平衡問題,2-1,,,針對于項目內(nèi)部和跨項目的類不平衡問題分別提出了一種解決方法,如下:,,項目內(nèi)的類不平衡問題,對于項目內(nèi)的類不平衡問題,通過引入子類判別分析(subclass discriminant analysis,SDA)

26、去解決類不平衡問題,并對其進(jìn)行了改進(jìn)以得到平衡分布的子類,稱為ISDA(improved SDA),跨項目的類不平衡問題,對于跨項目的類不平衡問題,首先通過遷移學(xué)習(xí)方法——半監(jiān)督的遷移成分分析(semi-supervised transfer component analysis,SSTCA),使目標(biāo)項目的數(shù)據(jù)分布與源項目相似。在此基礎(chǔ)上,再使用ISDA進(jìn)行類不平衡學(xué)習(xí),,Xiao-Yuan Jing, Fei Wu, Xiwei Do

27、ng, Baowen Xu: An Improved SDA Based Defect Prediction Framework for Both Within-Project and Cross-Project Class Imbalance Problems. TSE, 2017.,軟件缺陷預(yù)測,2-1,,,本文為項目內(nèi)部和跨項目中類的不平衡問題提供一種有效統(tǒng)一的解決方案。,類不平衡問題的統(tǒng)一缺陷預(yù)測框架,,ISDA將有缺陷和無

28、缺陷的實例劃分為適當(dāng)數(shù)量的平衡子類。然后,利用SDA從原始度量中得到具有良好判別能力的特征。最后,利用隨機森林分類器可以得到預(yù)測結(jié)果。,我們選擇了一種最先進(jìn)的遷移學(xué)習(xí)方法 — 半監(jiān)督遷移成分分析(transfer component analysis, TCA ),使目標(biāo)項目的數(shù)據(jù)分布與源項目相似。從而源項目和目標(biāo)項目有相同的投影變換,然后,通過ISDA學(xué)習(xí)投影轉(zhuǎn)換,并利用所學(xué)到的投影變換,得到源項目和目標(biāo)項目相對應(yīng)的投影特征。最后利用

29、隨機林分類器,可以得到目標(biāo)項目的類標(biāo)簽。,,Xiao-Yuan Jing, Fei Wu, Xiwei Dong, Baowen Xu: An Improved SDA Based Defect Prediction Framework for Both Within-Project and Cross-Project Class Imbalance Problems. TSE, 2017.,軟件缺陷預(yù)測,2-1,,,現(xiàn)有的跨公司的缺

30、陷預(yù)測方法(Cross-company defect prediction ,CCDP)都是基于這樣一個假設(shè):“源數(shù)據(jù)與目標(biāo)公司的數(shù)據(jù)應(yīng)具有同樣的軟件度量”,也就是度量類型和度量集的大小相同。,對于訓(xùn)練數(shù)據(jù)來說,共有的度量數(shù)量太少特有的度量可能具備更好的判別能力,但無法充分利用,,四家公司缺陷數(shù)據(jù)使用的度量,Xiao-Yuan Jing, Fei Wu, Xiwei Dong, Fumin Qi, Baowen Xu: Hetero

31、geneous Cross-Company Defect Prediction by Unified Metric Representation and CCA-Based Transfer Learning. FSE, 2015.,●基于典型相關(guān)分析的異質(zhì)跨公司缺陷預(yù)測,軟件缺陷預(yù)測,2-1,,,Xiao-Yuan Jing, Fei Wu, Xiwei Dong, Fumin Qi, Baowen Xu: Heterogeneous

32、 Cross-Company Defect Prediction by Unified Metric Representation and CCA-Based Transfer Learning. FSE, 2015.,軟件缺陷預(yù)測,2-1,針對異構(gòu)的源和目標(biāo)數(shù)據(jù)的UMR構(gòu)造說明,,,本文稱這種針對異構(gòu)跨公司的缺陷預(yù)測方法為CCA+,提出了一種統(tǒng)一源數(shù)據(jù)和目標(biāo)公司數(shù)據(jù)的度量表示(unified metric representation

33、, UMR),基于UMR,首次將遷移學(xué)習(xí)方法——典型相關(guān)分析(canonical correlation analysis ,CCA)引入跨公司的缺陷預(yù)測(CCDP)當(dāng)中,使得目標(biāo)公司與源公司具有相似的數(shù)據(jù)分布。,,Xiao-Yuan Jing, Fei Wu, Xiwei Dong, Fumin Qi, Baowen Xu: Heterogeneous Cross-Company Defect Prediction by Unif

34、ied Metric Representation and CCA-Based Transfer Learning. FSE, 2015.,軟件缺陷預(yù)測,2-1,,,Zhiqiang Li, Xiao-Yuan Jing, Xiaoke Zhu, Hongyu Zhang, Baowen Xu, Shi Ying: On the Multiple Sources and Privacy Preservation Issues for H

35、eterogeneous Defect Prediction, TSE, 2018.,多源(multiple sources)問題,隱私保護(hù)(privacy preservation)問題,,,基于單個源項目來預(yù)測目標(biāo)項目不但源與目標(biāo)項目之間存在異質(zhì)性,而且多個源之間也存在異質(zhì)性,構(gòu)建HDP模型的一個先決條件是來自其他公司的外部項目能夠獲得到由于數(shù)據(jù)的隱私問題,源數(shù)據(jù)擁有者并不愿意分享他們的數(shù)據(jù),現(xiàn)有的HDP方法并沒有考慮研究以下兩

36、個問題:,●基于多源與隱私保護(hù)的異質(zhì)缺陷預(yù)測,軟件缺陷預(yù)測,2-1,,,本文我們首次研究異質(zhì)缺陷預(yù)測( HDP )中的多源問題與隱私保護(hù)問題:,Zhiqiang Li, Xiao-Yuan Jing, Xiaoke Zhu, Hongyu Zhang, Baowen Xu, Shi Ying: On the Multiple Sources and Privacy Preservation Issues for Heterogeneou

37、s Defect Prediction, TSE, 2018.,軟件缺陷預(yù)測,2-1,,,,通過對多個源項目使用稀疏表示的雙混淆算法(SRDO)得到隱私性比較高的新的多個源項目。,采用基于多源選擇的流形鑒別對齊方法(MSMDA)建立HDP模型。最后,基于訓(xùn)練后的HDP模型,對目標(biāo)中的測試數(shù)據(jù)進(jìn)行了預(yù)測。,,Zhiqiang Li, Xiao-Yuan Jing, Xiaoke Zhu, Hongyu Zhang, Baowen Xu,

38、Shi Ying: On the Multiple Sources and Privacy Preservation Issues for Heterogeneous Defect Prediction, TSE, 2018.,軟件缺陷預(yù)測,2-1,,,Zhiqiang Li, Xiao-Yuan Jing, Xiaoke Zhu, Hongyu Zhang: Heterogeneous Defect Prediction throug

39、h Multiple Kernel Learning and Ensemble. ICMSE, 2017.,線性不可分(linearly inseparable)問題,類不平衡(class imbalanced)問題,,,缺陷數(shù)據(jù)通常位于非線性的特征空間中,具有線性不可分的特性現(xiàn)有的HDP方法并沒有研究缺陷數(shù)據(jù)的線性相關(guān)性關(guān)系,這些方法可能會遭受線性不可分問題,缺陷數(shù)據(jù)通常是類不平衡的,具有類不平衡的特性現(xiàn)有的HDP方法并沒有研究缺

40、陷數(shù)據(jù)的類不平衡特性,這些方法通常會遭受類不平衡問題,現(xiàn)有的HDP方法并沒有考慮缺陷數(shù)據(jù)的兩個特性,可能會存在以下兩個問題:,●多核學(xué)習(xí)和集成學(xué)習(xí)的異質(zhì)缺陷預(yù)測,軟件缺陷預(yù)測,2-1,,,考慮到以上缺陷數(shù)據(jù)的兩個特性,我們提出了一種新的HDP方法:集成多核相關(guān)對齊學(xué)習(xí)(Ensemble Multiple Kernel Correlation Alignment Learning,EMKCA)),線性不可分問題,類不平衡問題,,多核學(xué)習(xí)技

41、術(shù),,集成學(xué)習(xí)技術(shù),EMKCA方法,將源和目標(biāo)數(shù)據(jù)映射到高維內(nèi)核空間,結(jié)合多個內(nèi)核分類器,減輕類不平衡的影響,,,,軟件缺陷預(yù)測,2-1,Zhiqiang Li, Xiao-Yuan Jing, Xiaoke Zhu, Hongyu Zhang: Heterogeneous Defect Prediction through Multiple Kernel Learning and Ensemble. ICMSE, 2017.,,,考慮

42、到以上缺陷數(shù)據(jù)的兩個特性,我們提出了一種新的HDP方法,即代價敏感遷移核典型相關(guān)分析(Ensemble Multiple Kernel Correlation Alignment Learning,EMKCA)),EMKCA方法示意圖,,將歷史缺陷數(shù)據(jù)映射到高維特征空間中以改善其可分離性。,多核學(xué)習(xí)可以組裝不同類型的核函數(shù),并利用每個基本核函數(shù)的優(yōu)勢來提高預(yù)測精度。,使用一組分類器進(jìn)行預(yù)測,提高了分類器的泛化能力。,,,軟件缺陷預(yù)測,2

43、-1,Zhiqiang Li, Xiao-Yuan Jing, Xiaoke Zhu, Hongyu Zhang: Heterogeneous Defect Prediction through Multiple Kernel Learning and Ensemble. ICMSE, 2017.,,,Zhiqiang Li, Xiao-Yuan Jing, Fei Wu, Xiaoke Zhu, Baowen Xu, Shi Ying

44、: Cost-Sensitive Transfer Kernel Canonical Correlation Analysis for Heterogeneous Defect Prediction. ASE Journal, 2018.,在2018年工作中,基于HDP工作中缺陷數(shù)據(jù)的線性不可分和類不平衡問題,我們提出了一種新的方法,即代價敏感遷移核典型相關(guān)分析(cost-sensitive transfer kernel canoni

45、cal correlation analysis, CTKCCA),CTKCCA方法示意圖,線性不可分問題,類不平衡問題,,核學(xué)習(xí)技術(shù),,代價敏感學(xué)習(xí)技術(shù),,,在28個項目上,CTKCCA方法取得了較好預(yù)測結(jié)果,軟件缺陷預(yù)測,2-1,,,Zhiqiang Li, Xiao-Yuan Jing, Xiaoke Zhu: Heterogeneous Fault Prediction with Cost Sensitive Domain Ad

46、aptation. STVR, 2018.,現(xiàn)有的HDP方法并沒有考慮如何使用混合項目(項目內(nèi)與跨項目)數(shù)據(jù):,在軟件測試的早期階段,一些項目可能只有較少數(shù)量的歷史缺陷數(shù)據(jù),所學(xué)習(xí)的預(yù)測模型往往具有較差的性能,在實踐中,我們可以收集到一些公開的缺陷數(shù)據(jù)集或開源項目,并提取相關(guān)的缺陷預(yù)測數(shù)據(jù),,,如何使用混合項目(項目內(nèi)與跨項目)數(shù)據(jù)用于HDP并沒有得到研究?如何同時處理項目內(nèi)與跨項目中存在的類不平衡問題?,●基于代價敏感域自適應(yīng)的異質(zhì)

47、缺陷預(yù)測,軟件缺陷預(yù)測,2-1,,,對于以上兩個問題的解決辦法:,Zhiqiang Li, Xiao-Yuan Jing, Xiaoke Zhu: Heterogeneous Fault Prediction with Cost Sensitive Domain Adaptation. STVR, 2018.,軟件缺陷預(yù)測,2-1,,,本文我們考慮以上兩個問題,提出了一種新的HDP方法,即代價敏感標(biāo)簽與結(jié)構(gòu)一致性單向投影(cost-se

48、nsitive label-and-structure-consistent unilateral projection, CLSUP),CLSUP方法示意圖,采用遷移學(xué)習(xí)技術(shù) -- 異構(gòu)域自適應(yīng)(標(biāo)簽和結(jié)構(gòu)一致的單向投影(LSUP) ),使兩個域的數(shù)據(jù)分布相似。同時引入代價敏感學(xué)習(xí)技術(shù)解決類不平衡問題。,,Zhiqiang Li, Xiao-Yuan Jing, Xiaoke Zhu: Heterogeneous Fault Pred

49、iction with Cost Sensitive Domain Adaptation. STVR, 2018.,軟件缺陷預(yù)測,2-1,,,Fei Wu, Xiao-Yuan Jing, Ying Sun, Jing Sun, Lin Huang, Fangyi Cui, Yanfei Sun: Cross-Project and Within-Project Semisupervised Software Defect Predic

50、tion: A Unified Approach. TR, 2018.,現(xiàn)有的CPDP方法通常需要大量的已標(biāo)記的數(shù)據(jù),一些項目可能只有較少數(shù)量的已標(biāo)記歷史缺陷數(shù)據(jù)。半監(jiān)督缺陷預(yù)測可以利用大量容易獲得的無標(biāo)記數(shù)據(jù)。將結(jié)合跨項目和半監(jiān)督方法稱為跨項目半監(jiān)督缺陷預(yù)測(CSDP),現(xiàn)有的項目內(nèi)部半監(jiān)督缺陷預(yù)測(WSDP)方法通常依賴于預(yù)測模型的好壞,或者簡單利用缺陷數(shù)據(jù)間的相似性,缺少充分的特征學(xué)習(xí)過程。,提供一個統(tǒng)一的學(xué)習(xí)框架:同時研究CSD

51、P和WSDP方法,利用字典學(xué)習(xí)技術(shù),提高預(yù)測模型的特征學(xué)習(xí)能力,同時在字典學(xué)習(xí)基礎(chǔ)上做了代價敏感和核化的技術(shù)提升。,●基于代價敏感核半監(jiān)督字典學(xué)習(xí)的缺陷預(yù)測,,,軟件缺陷預(yù)測,2-1,,,本文我們提出代價敏感的核化半監(jiān)督字典學(xué)習(xí)(Costsensitive Kernelized Semisupervised Dictionary Learning),半監(jiān)督字典學(xué)習(xí)(SDL)技術(shù),SDL示意圖,利用大量的無標(biāo)記數(shù)據(jù),增強特征學(xué)習(xí)能力,,,

52、增強模型的可分離性,,,缺陷預(yù)測中經(jīng)常遇到誤分類問題,Kernel技術(shù),Cost-sensitive技術(shù),CKSDL方法,在16個項目上取得了較好的結(jié)果。,,,軟件缺陷預(yù)測,2-1,Fei Wu, Xiao-Yuan Jing, Ying Sun, Jing Sun, Lin Huang, Fangyi Cui, Yanfei Sun: Cross-Project and Within-Project Semisupervised So

53、ftware Defect Prediction: A Unified Approach. TR, 2018.,,工作量估計,2-2,,軟件工作量估計,,,歷史數(shù)據(jù),預(yù)測模型,待開發(fā)項目,人力成本(effort),訓(xùn)練,預(yù)測,,工作量估計是軟件開發(fā)關(guān)鍵步驟,1、工作量估計數(shù)據(jù)缺失補全,2、工作量估計數(shù)據(jù)隱私保護(hù),3、工作量估計數(shù)據(jù)匱乏問題,工作量估計研究內(nèi)容,結(jié)構(gòu)化低秩恢復(fù)缺失數(shù)據(jù)補全算法,,半監(jiān)督回歸補全算法,,數(shù)據(jù)缺失場景:,,數(shù)據(jù)

54、補全方法:,,,自變量,因變量,數(shù)據(jù)集,●工作量估計數(shù)據(jù)缺失補全,,工作量估計,2-2,,Xiao-Yuan Jing, Fumin Qi, Fei Wu, Baowen Xu: Missing data imputation based on low-rank recovery and semi-supervised regression for software effort estimation. ICSE 2016.,,工作量估

55、計,2-2,,Cyclic weighted median(CWM),圖像數(shù)據(jù)補全,工作量估計數(shù)據(jù)補全,,,工作量數(shù)據(jù)隨機排列,圖像的像素結(jié)構(gòu),結(jié)構(gòu)化工作量估計數(shù)據(jù),,,構(gòu)建全連接圖,,,,頂點:缺失數(shù)據(jù),邊:歐式距離,最小生成樹問題,Xiao-Yuan Jing, Fumin Qi, Fei Wu, Baowen Xu: Missing data imputation based on low-rank recovery and se

56、mi-supervised regression for software effort estimation. ICSE 2016.,,工作量估計,2-2,,Fumin Qi, Xiao-Yuan Jing, Xiaoke Zhu, Fei Wu, Li Cheng: Privacy preserving via interval covering based subclass division and manifold learni

57、ng based bi-directional obfuscation for effort estimation. ASE 2016.,工作量數(shù)據(jù)的隱私化工作研究較少,Effort相近的樣本,數(shù)據(jù)分布是近似,無類別的工作量數(shù)據(jù)可以轉(zhuǎn)換為有類別的數(shù)據(jù),未隱私化的數(shù)據(jù),競爭對手獲取信息(例如,競標(biāo)價),,,隱私問題,●工作量估計數(shù)據(jù)隱私保護(hù),,工作量估計,2-2,,,子類1,子類2,子類3,子類4,,,,,,,,中心點:概率大的樣本

58、范 圍:effort 誤差在25%以內(nèi),Step 1:,Step 2:,最近不相關(guān)近鄰樣本對目標(biāo)樣本進(jìn)行雙向混淆,維持原始數(shù)據(jù)的分布特性.,Fumin Qi, Xiao-Yuan Jing, Xiaoke Zhu, Fei Wu, Li Cheng: Privacy preserving via interval covering based subclass division and manifold learning based

59、 bi-directional obfuscation for effort estimation. ASE 2016.,,工作量估計,2-2,,Fumin Qi, Xiao-Yuan Jing, Xiaoke Zhu, Xiaoyuan Xie, Baowen Xu, Shi Ying: Software effort estimation based on open source projects: Case study of Gi

60、thub. Information & Software Technology, 2017.,●工作量估計數(shù)據(jù)匱乏問題,開源項目較少,ISBSG和Promise Repository,已公布的數(shù)據(jù)集數(shù)據(jù)共享困難,涉及商業(yè)機密,工作量估計建模中,數(shù)據(jù)是關(guān)鍵因素,自己提取數(shù)據(jù)集過程繁瑣,GitHub,數(shù)據(jù)匱乏,,,開源項目托管平臺,豐富數(shù)據(jù),,利用GitHub, 實現(xiàn)自動提取工作量估計數(shù)據(jù)平臺,,工作量估計,2-2,,●獲得數(shù)據(jù)用于

61、工作量估計,數(shù)據(jù)采集,用收集到的數(shù)據(jù)訓(xùn)練預(yù)測模型。,數(shù)據(jù)集擴展,工作量估計部分,從GitHub獲得項目數(shù)據(jù)并且進(jìn)行過濾,提取必要數(shù)據(jù)。,實現(xiàn)自動提取,獲得更多數(shù)據(jù)。,Fumin Qi, Xiao-Yuan Jing, Xiaoke Zhu, Xiaoyuan Xie, Baowen Xu, Shi Ying: Software effort estimation based on open source projects: Case s

62、tudy of Github. Information & Software Technology, 2017.,,工作量估計,2-2,,使用功能點和人員因素作為收集數(shù)據(jù)的模型,傳統(tǒng)人員因素是定性的評價,無法較好地反映開發(fā)團(tuán)隊的情況。,設(shè)計定量評價人員因素方法,ABCART:AdaBoost and Classification And Regression Tree,提出了一個ABCART算法增量式的收集數(shù)據(jù),Fumin Q

63、i, Xiao-Yuan Jing, Xiaoke Zhu, Xiaoyuan Xie, Baowen Xu, Shi Ying: Software effort estimation based on open source projects: Case study of Github. Information & Software Technology, 2017.,,,,,3,,近期工作介紹,,Outline,,,,,,,

64、基于機器學(xué)習(xí)的軟件工程技術(shù)研究,,,分辨率越低,難點,●基于半耦合與低秩鑒別字典的超分辨率行人重識別方法,行人重識別,3.1,特征信息越少,鑒別能力越弱,,,Xiao-Yuan Jing, Xiaoke Zhu, Fei Wu, Ruimin Hu, Xinge You, Yunhong Wang, Hui Feng, and Jing-Yu Yang: Super-resolution Person Re-identificatio

65、n with Semi-coupled Low-rank Discriminant Dictionary Learning. CVPR2015, TIP2017.,,,解決方法--SLD2L,基于低秩半耦合鑒別字典學(xué)習(xí)的超分辨率行人重識別方案,1/8 i-LIDS dataset,1/8 PRID dataset (Multi-shot),1/8 ETHZ dataset,生成低分辨率圖像,按patch聚類,進(jìn)行高低分辨率圖像的字典學(xué)習(xí)

66、,半耦合有監(jiān)督低秩學(xué)習(xí),投影,行人重識別,3.1,Xiao-Yuan Jing, Xiaoke Zhu, Fei Wu, Ruimin Hu, Xinge You, Yunhong Wang, Hui Feng, and Jing-Yu Yang: Super-resolution Person Re-identification with Semi-coupled Low-rank Discriminant Dictionary L

67、earning. CVPR2015, TIP2017.,,,,什么是圖片對視頻的行人重識別?,當(dāng)給出某人的一張照片,如何從從監(jiān)控視頻中檢索到這個人?,圖片和視頻的特征表示方式不同同一視頻內(nèi)不同幀之間存在較大差異,難點,●基于異質(zhì)字典對與投影矩陣的行人重識別方法,Xiaoke Zhu, Xiao-Yuan Jing, Xinge You, Wangmeng Zuo, Shiguang Shan, Wei-Shi Zheng: Image

68、 to Video Person Re-identification by Learning Heterogeneous Dictionary Pair with Feature Projection Matrix. AAAI 2017, TIFS 2018.,行人重識別,3.1,,,異構(gòu)字典對學(xué)習(xí),多視圖投影矩陣學(xué)習(xí),視頻:聚類—投影—字典學(xué)習(xí),圖片:字典學(xué)習(xí),,同一編碼系數(shù)空間,將多個視圖的結(jié)果進(jìn)行加權(quán)求和,行人重識別,3.1,Xi

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論