<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><meta http-equiv=Content-Type content="text/html; charset=utf-8"><meta name=Generator content="Microsoft Word 14 (filtered medium)"><style><!--
/* Font Definitions */
@font-face
        {font-family:宋体;
        panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
        {font-family:宋体;
        panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:"\@宋体";
        panose-1:2 1 6 0 3 1 1 1 1 1;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#44546A;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri","sans-serif";}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.25in 1.0in 1.25in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]--></head><body lang=EN-US link="#0563C1" vlink="#954F72"><div class=WordSection1><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#44546A'>Pls go to this one if you are interested.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#44546A'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#44546A'>Kenny<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#44546A'><o:p> </o:p></span></p><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span></b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'> Weinan Zhang [mailto:wnzhang@sjtu.edu.cn] <br><b>Sent:</b> Wednesday, December 13, 2017 1:23 PM<br><b>To:</b> all@cs.sjtu.edu.cn<br><b>Cc:</b> </span><span lang=ZH-CN style='font-size:10.0pt;font-family:宋体'>俞勇</span><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'><br><b>Subject:</b> </span><span lang=ZH-CN style='font-size:10.0pt;font-family:宋体'>【学术报告】</span><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>12.20 2PM Jiawei Han: Multi-Dimensional Analysis of Massive Text Corpora<o:p></o:p></span></p><p class=MsoNormal><o:p> </o:p></p><div><p class=MsoNormal><span lang=ZH-CN style='font-family:宋体'>各位老师好,</span><o:p></o:p></p><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal>UIUC<span lang=ZH-CN style='font-family:宋体'>的</span>Jiawei Han<span lang=ZH-CN style='font-family:宋体'>教授下周三来交大做报告,欢迎您和学术参加!</span><o:p></o:p></p></div><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal><span lang=ZH-CN style='font-family:宋体'>时间:</span>2017<span lang=ZH-CN style='font-family:宋体'>年</span>12<span lang=ZH-CN style='font-family:宋体'>月</span>20<span lang=ZH-CN style='font-family:宋体'>日,星期三,下午</span>2<span lang=ZH-CN style='font-family:宋体'>点</span>-4<span lang=ZH-CN style='font-family:宋体'>点</span><o:p></o:p></p></div><div><p class=MsoNormal><span lang=ZH-CN style='font-family:宋体'>地点:光彪楼多功能厅</span><o:p></o:p></p></div><div><p class=MsoNormal><span lang=ZH-CN style='font-family:宋体'>主持:俞勇教授</span><o:p></o:p></p></div><div><p class=MsoNormal><o:p> </o:p></p><div><div><p class=MsoNormal>Title: Multi-Dimensional Analysis of Massive Text Corpora<o:p></o:p></p></div><div><p class=MsoNormal> <o:p></o:p></p></div><div><p class=MsoNormal>Speaker: Jiawei Han, Abel Bliss Professor, Department of Computer Science, University of Illinois at Urbana-Champaign<o:p></o:p></p></div><div><p class=MsoNormal> <o:p></o:p></p></div><div><p class=MsoNormal>ABSTRACT<o:p></o:p></p></div><div><p class=MsoNormal> <o:p></o:p></p></div><div><p class=MsoNormal>The real-world big data are largely unstructured and interconnected, in the form of natural language text.  It is highly desirable to conduct multi-dimensional anaysis on massive text data.   However, this poses a major challenge on how to transform unstructured text data into structured text and analyze such data in multidimensional space.  To faciltiate such analytical functionality, we propose a textcube modeling and discuss how to construct such cubes from massive text coropora and how to conduct multidimensional OLAP analysis using such textcubes.  In the past several years, we have developed a text mining approach that only requires distant or minimal supervision but relies on massive data.  We show (i) quality phrases can be mined from such massive text data, (ii) types can be extracted from massive text data with distant supervision, (iii) entities, attributes and values can be discovered by meta-path directed pattern discovery, (iv) faceted taxonomy can be constructed from massive corpora, (v) textcubes can be constructed from massive text, and (v) multi-dimensional analysis can be conducted on such cubes.  We show such a paradigm represents a promising direction at turning massive text data into structured and useful knowledge.<o:p></o:p></p></div><div><p class=MsoNormal> <o:p></o:p></p></div><div><p class=MsoNormal>Short bio:<o:p></o:p></p></div><div><p class=MsoNormal> <o:p></o:p></p></div><div><p class=MsoNormal>Jiawei Han is Abel Bliss Professor in the Department of Computer Science, University of Illinois at Urbana-Champaign.   He has been researching into data mining, information network analysis, database systems, and data warehousing, with over 900 journal and conference publications. He has chaired or served on many program committees of international conferences in most data mining and database conferences.  He also served as the founding Editor-In-Chief of ACM Transactions on Knowledge Discovery from Data and the Director of Information Network Academic Research Center supported by U.S. Army Research Lab (2009-2016), and is the co-Director of KnowEnG, an NIH funded Center of Excellence in Big Data Computing since 2014.  He is Fellow of ACM, Fellow of IEEE, and received 2004 ACM SIGKDD Innovations Award, 2005 IEEE Computer Society Technical Achievement Award, and 2009 M. Wallace McDowell Award from IEEE Computer Society.  His co-authored book "Data Mining: Concepts and Techniques" has been adopted as a textbook popularly worldwide.<o:p></o:p></p></div></div><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal><span lang=ZH-CN style='font-family:宋体'>祝好!</span><o:p></o:p></p></div><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal><span lang=ZH-CN style='font-family:宋体'>张伟楠</span><o:p></o:p></p></div></div></div></div></body></html>