黑客的征途是星辰大海,更是狂风暴雨
经过长达一个半月(2015 年 2 月 10 日 - 3 月 20 日)的激烈竞逐后,开源社成员微软开放技术,GitCafe,极客学院联合举办的 Open XML SDK 在线编程黑客松完美收官。最后入围决赛的有 5 个优秀项目,评审们经过激烈地讨论,决定将优胜大奖由一名增加为三名,最终由瞿杰的 Toxy 荣获 「最完美表现奖」,凌峰的 Office Document Query 荣获「最具突破性奖」,潘纯的 PPT2SVG 荣获「最具实用价值奖」,主评审委员 Eric White 更分别致函赞扬。另外二个优秀项目朱虎的 Day4Day 及邹昕的 PPTX Player 也获得评审的欣赏,所有入围项目均喜获各式大礼包及参加奖。
优胜大奖
微软最豪华的 MSDN 订阅服务旗舰版 (Visual Studio Ultimate with MSDN Subscriptions) 一年免费订阅。
大礼包
开源社大礼包、微软开放技术帽衫、GitCafe 大礼包/帽衫
参加奖
GitCoin:可以购买 GitCafe 额外托管空间升级和私有项目托管在内的服务。
极客学院 VIP 月会员:特别为每位参赛人员提供月 VIP 码,用户可以免费学习极客学院全网课程。
优秀项目大 PK
Toxy
作者:瞿杰
项目描述:.NET 数据抽取框架
单位:Neuzilla
开源许可证:Apache 2.0
-
项目地址:
https://gitcafe.com/tonyqus/Toxy
评委评论:Awesome tool, great presentation, cool technology. It is an on-going, long running open source project, which is awesome. Toxy enables retrieval of text information from a wide variety of document sources. In these days of big data and cloud-based search engines, having an open source project like this to provide the raw data for search engines is really super. Toxy has high ambitions for this project, including development of a custom query engine with a specialized language specifically designed for querying content in documents.
Office Document Query
作者:凌峰
项目描述:面向 OOXML、ODF 和 UOF 的文档查询语言,可供文档检索工具或 wen office 使用
单位:北京信息科技大学
开源许可证:BSD
-
项目地址:
https://gitcafe.com/tomoko/Office_Document_Query
评委评论:This is a brilliant idea - a query language for office documents, implemented using interoperability which devoted to extracting content from document. The founder of this project is doing potentially ground-breaking work in design of a query language, which he calls ODQ.
PPK(控)
作者:潘淳
项目描述:针对 PPT 格式进行 Hack,创造出前所未有的应用
单位:邮储银行
开源许可证:Apache 2.0
-
项目地址:
https://gitcafe.com/geeknow/PPT2SVG
评委评论:The PPT2SVG project is super-interesting a transform from PresentationML to SVG is a great first step in an open-source PPTX viewer in the browser. It is a non-trivial problem, and it can become a useful tool in the Open XML developer’s toolbox.
day4day
pptx player
作者:周昕
项目描述:类似 infoq 的幻灯片播放工具
单位:明道
开源许可证:MIT
项目地址:https://gitcafe.com/ipy/Json2Document
评委评论:Nice, functional programming style. Interesting, similar to my doc gen project, except that data source is JSON, which is a good idea.
挑战与机遇 - 反馈与建议
国内现状
优势:
Open XML SDK 的主要应用场景包括但不限于各种文档的处理 (EXCEL、WORD、PPT):高速处理或批量生成文档;批量修改、删除文档内容或持续跟踪文档内容,汇编及统计工作;直接支持支持数据和内容查询、提取等内容级搜索及分析工作;实现文档格式的转换,尤其是网页格式的转换及近期大热的 H5 和 SVG 等格式;文档内容的在线展示及摘要功能;文档功能的 HACK 以产生全新的预留留功能,如特殊动画、锁定、超级渐变等。
Open XML SDK 2.5 附带的生产力工具包非常有用,开发者用它来做 XML 文档的验证以及代码自动产生。 而微软提供的 PowerTools for Open XML 则相当地容易使用,但还是无法覆盖许多通用文档处理的场景。
由开源社区提供的 NPOI 与 EPPlus 等项目应用泛围广泛,可部分弥补 Open XML SDK 与 PowerTools 的不足。
劣势:
目前 Open XML SDK 对不熟悉 Open XML 文件标准的开发者来说,过于底层而不易使用,它的产品设计假设使用者对 Open XML 非常熟悉,且不需要高级功能,比如 Excel 公式,所以实际使用范围并不大,只能解决 30% 左右的 Excel 导出需求,而Excel 仍然是 Office 应用大头。
Open XML SDK 本身是机器生成的代码,在功能布局上不是很合理,对产品的抽像不够。可能类似 Microsoft All-In-One CodeFramework Office 版的配套案例集会对推广起到事半功倍的作用。
由于许多中国用户习惯于在 Excel 档案里储存大量的数据,而 Open XML SDK 使用微软 XML Parser,从而导致其性能下降,表现不如用了其他替代方案的 NPOI 及 EPPlus。
OFFICE 规范的晦涩及 6000 页庞大的文档规模阻碍了客户的直接使用兴趣。在社区培育方面可能还刚刚开始,并没有一个明显社区及独立的讨论组,并没有形状一种互动与交流的态势。缺乏中文资料、文档、书籍大大增加学习成本,同时跟国内缺泛针对 OFFICE 开发题材的网站、社区也有关系,相较而言,VBA 的各种资源和研究人群要远远广得多。
发展前景
文档处理转向成熟期,以企业应用为主,分析 Excel 及生成 Word 文档成为企业流程化的主要需求;全种类文档的抽取及分析在搜索类项目中成为标准配置;用户从 Office 2003 向 Office 2007 或更高版本的迁移,也使用 OXD 项目越来越流行;除企业及项目外,PPT 类的客户端应用也是一枝独秀。未来文档增涨式爆发以及向移动端的迁移,使 OXS 的应用需求爆增。
重点发掘企业类需求,相比 VBA,VSTO 和 OXD 在企业中的应用价值更大。目前类似 Office 产品多不支持 VSTO 和 OXD,使得这方面的应用极具吸引力,而且需求空间巨大。
建议与期望
中国用户一般来说更偏好立即可用的工具,而非自行打造一个粗糙的软件开发工具包 (SDK)。期盼能有一个为 Open XML 开发者提供充分集成各式工具支持的「集成开发环境 (IDE)」:例如 SQL 报表服务里的报表模板。
需要对 Office 开发社区及讨论团体提供更多的支持及培养。也需要更多的本地化技术内容,如文档,视频集范例。
专注于培育 Open XML 的企业应用,引导企业 IT 开发者逐步使用 Visual Studio for Office工具。
Open XML SDK 的推广工作,要从培育和资源两个方向做起。
培育、扶持、组建一些 OFFICE 开发类的社区和讨论组,推广 Office 开发类的教程包括但不限于 OXD,还可以是 VSTO、SharePoint、数据挖掘等相关题材。培育一批经典开源项目提供更多的场景运用线索,将客户重新引导到 OXD。
提供更多资源来响应吸一些文档创作及编译工作参与进来,可以至少在国内出版或编译引进几本 OXD 相关书籍,一批优势的录像和课件资源,在国内多培养一些 OXD 相关的 MVP。
此外也要关注行业动态,并吸收新技术。
商业应用(部分摘录)
.NET 开源大数据解决方案 Lantea,Toxy 是其中的一部分。
PPT2SVG(亦或 PPT2H5)有着广泛的用途,类似的功能出现在 ISRPING 的最新版中,在 H5 大热的背景下会越来越有价值,尤其作为移动端的解决方案。国外类似的功能都是收费版,且功能不全。目前项目矢量化的部分完成度 70% 左右,动画转换功能暂未开始。国内类似的 H5 的解决方案,有许多来自国内外的客户,也反映出该需求的广泛性。
合作推广(部分摘录)
如果有机会进一步推广您在这次黑客松提交的项目,您是否愿意与微软开放技术合作?
非常愿意,包括且不限于教程、课件、视频、教程、书籍与专利合作等。
需要一起做推广和渠道。
希望进一步结合开放文件格式 (Open XML SDK) 以及开放数据 (OData)。
评审嘉宾
干货不断
这次我们为参赛队伍准备了丰富的技术干货,国内外高手无私分享以及技术支持,逐步引导的在线学习视频教程与技术文档,场景范例,在线编程及演示环境,社区互动等。如果您没有能够赶上这次盛会,您还是可以在下列链接直接获得这些干货。
开放黑客松
我们为大家搭建了在公有云 (Azure) 运行的在线编程服务(包含开发/学习/演示/部署)「开放黑客松」,让您无论何时何地,只要有浏览器,就可以开始任性编程,而不需要辛辛苦苦搭建环境,安装软件。
学习视频
极客学院在线学习视频教程
Open XML SDK 简介
下载和编译 Open XML SDK(Windows 系统)
下载和编译 Open XML SDK(Linux 系统)
使用 PowerTools for Open XML(Windows 系统)
优酷在线学习视频教程(新增)
Open XML 开发速学指南
Open XML SDK 生产力工具简介
Open XML Package Editor PowerTool 简介
OOXML Tools for Chrome 工具扩展
WordprocessingML 相关场景快速入门
SpreadsheetML 与 PresentationML 相关场景快速入门
使用 Open XML 工具集以及 Open XML SDK 接受修订记录
使用 Open XML SDK 的标记扩展性和兼容性功能来处理文本
使用 Open XML SDK 以及 Open XML 扩展工具集通过 ASP.NET 应用将 DOCX 文档发布为 HTML 网页
技术帮助文档
此外还有各种学习帮助,如丰富的技术文档,场景范例及提示,开发者社区链接,Open XML SDK源代码等:
GitCafe 帮助文档、Open-XML-SDK 项目地址、Open-XML-SDK 官方技术文档、各种场景范例
开发者社区
http://openxmldeveloper.org/
http://www.csdn.net/tag/openxml/
合作主办方
风暴不息,持续关注
点击「阅读原文」可观看和下载学习视频及技术文档,也欢迎您访问开源社官网 http://www.kaiyuanshe.cn/ 了解更多信息 。
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系
[邮箱地址] 删除
|