高校智能化教学与实训平台

经典算法阅读与标注

  • 代码标注 07/01/2019 00:00 ~ 2019-07-25 24:00
  • 标注互评 07/26/2019 00:00 ~ 2019-07-31 24:00

标注说明:每个小组选择一个项目,针对标注任务中指定的标注模块,要求对代码模块、模块中的代码文件, 以及文件中的函数必须进行标注,关键代码块、代码行及关键变量等由参赛者自由选择进行标注。请大家根据个人理解,写出自己的风格。我们将综合考虑标注的原创性、准确性、 完整性和多样性等不同的维度对标注质量进行评分。模拟赛选择了第一届标注大赛正式赛第一阶段的三个项目供大家体验熟悉平台、学习其他人的标注,模拟赛标注不计分。

  • Java项目

    Weka

    项目简介

    Weka是基于Java的机器学习与数据挖掘平台,汇集了最前沿的机器学习算法,包括处理标准数据挖掘问题的几乎所有方法:回归、分类、聚类、关联规则以及属性选择等,是Java机器学习入门的首选平台。

    本项目的Clusters目录中包含了K-Means、层次聚类等多种聚类算法以及相应的聚类效果评估方法的java实现

    标注任务

    标注../weka/clusterers/目录下的所有代码文件。

    经典算法解读:

    点击进入代标注模块

  • C++项目

    mandliya

    项目简介

    该项目是GitHub上最受欢迎的C++语言实现经典算法与数据结构的项目之一,内容涵盖排序、链表、树结构、图搜索、贪心算法等。学习这些算法的代码实现,可以深刻理解和掌握算法的核心思想,感受算法之美,代码之美,是人工智能时代的基础入门一课。

    本项目的sort_search_problems目录涵盖了冒泡排序、快速排序等各类经典排序算法的C++实现。

    标注任务

    标注../sort_search_problems目录下的所有代码文件及对应引用的../include目录中自定义的头文件。

    经典算法解读:

    点击进入代标注模块

  • Python项目

    TheAlgorithms

    项目简介

    该项目是GitHub上最受欢迎的Python语言实现经典算法的项目之一,包含了前沿的神经网络和经典数据结构及算法的Python实现。项目具有兼顾经典和前沿的特点。学习经典算法的源码实现,感受经典算法的思想之美、代码之美。

    本项目的Sorts目录中包含了冒泡排序、快速排序等各类经典排序算法的Python实现。

    标注任务

    标注../sorts/目录下的所有代码文件。

    经典算法解读:

    点击进入代标注模块

自然语言处理NLP

  • 代码标注 08/01/2019 00:00 ~ 2019-10-10 24:00
  • 标注互评 10/11/2019 00:00 ~ 2019-10-31 24:00

标注说明:每个小组选择一个项目,针对标注任务中指定的标注模块,要求对代码模块、模块中的代码文件, 以及文件中的函数必须进行标注,关键代码块、代码行及关键变量等由参赛者自由选择进行标注。请大家根据个人理解,写出自己的风格。我们将综合考虑标注的原创性、准确性、 完整性和多样性等不同的维度对标注质量进行评分。第一阶段比赛得分占正赛总比分的30%。

  • Java项目

    CoreNLP

    项目简介

    CoreNLP是一个Java自然语言分析库,是斯坦福大学自然语言处理小组的研究成果,它集成了所有的自然语言处理工具:分词、词性标注、依存句法分析、命名实体识别等。

    本项目的stanford/nlp/parser/目录中包含了Lexparser、nndep以及Shiftreduce等句法分析算法的Java实现。

    标注任务

    标注../stanford/nlp/parser/目录下的所有代码文件(包括子目录)。

    经典算法解读:

    点击进入代标注模块

  • C++项目

    Sentencepiece

    项目简介

    Sentencepiece是Google公司开发的一个C++自然语言处理工具包,它实现了数据驱动、跨语言、高性能、轻量级的面向神经网络文本生成系统的无监督文本词条化工具。

    本项目的src/目录中包含了BPE、Unigram以及Char等文本分词算法的C++实现。

    标注任务

    标注../src/目录下的所有.cc和.h代码文件(不包括子目录)。

    经典算法解读:

    点击进入代标注模块

  • Python项目

    NLTK

    项目简介

    NLTK是宾西法尼亚大学计算机和信息科学系开发的一个Python自然语言处理工具包,它提供了易于使用的接口,通过这些接口可以访问超过50个语料库和词汇资源(如WordNet),还有一套用于分类、标记化、词干标记、解析和语义推理的文本处理库。

    本项目的nltk/stem/目录中包含了Lancaster、Porter以及Snowball等文本分词算法的Python实现。

    标注任务

    标注../nltk/stem/目录下的所有代码文件。

    经典算法解读:

    点击进入代标注模块

深度学习框架

  • 代码标注 08/06/2019 00:00 ~ 2019-10-10 24:00
  • 标注互评 10/16/2019 00:00 ~ 2019-10-31 24:00

标注说明:每个小组选择一个项目,针对标注任务中指定的标注模块,要求对代码模块、模块中的代码文件, 以及文件中的函数必须进行标注,关键代码块、代码行及关键变量等由参赛者自由选择进行标注。请大家根据个人理解,写出自己的风格。我们将综合考虑标注的原创性、准确性、 完整性和多样性等不同的维度对标注质量进行评分。第二阶段比赛得分占正赛总比分的70%。

  • Java项目

    Deeplearning4j

    项目简介

    Deeplearning4j是Eclipse公司开发的支持各种深度学习算法的运算框架,它可以实施的技术包括受限玻尔兹曼机、深度置信网络、深度自动编码器、堆叠式降噪自动编码器、循环神经张量网络,以及word2vec、doc2vec和GloVe等。

    本项目的nn/layers/recurrent/目录中包含了循环神经网络RNN中LSTM、Bidirectional LSTM等算法的Java实现。

    标注任务

    标注../nn/layers/recurrent/目录下的所有代码文件。

    经典算法解读:

    点击进入代标注模块

  • C++项目

    Tensorflow

    项目简介

    TensorFlow是谷歌人工智能团队开发的用于机器学习和深度神经网络研究的开源框架,它在图形分类、音频处理、推荐系统和自然语言处理等场景下都有丰富的应用,提供了丰富的API,包括基本的向量矩阵计算、各种优化算法、各种卷积神经网络和循环神经网络基本单元的实现、以及可视化的辅助工具等。

    本项目的core/kernels/rnn/目录中包含了循环神经网络RNN中卷积GEMM、LSTM以及GRU算法的C++实现。

    标注任务

    标注../core/kernels/rnn/目录下的所有代码文件。

    经典算法解读:

    点击进入代标注模块

  • Python项目

    Keras

    项目简介

    Keras是Google公司开发的高度模块化的神经网络学习框架,它是一个高层神经网络API,能够支持简易和快速的原型设计,支持CNN和RNN或二者的结合,且能够支持无缝CPU和GPU切换。

    本项目的keras/layers/目录中包含了神经网络运算层中Embedding、CNN以及RNN等算法的Python实现。

    标注任务

    标注../keras/layers/目录下的所有代码文件。

    经典算法解读:

    点击进入代标注模块

  • C++项目

    PaddlePaddle优化器

    项目简介

    飞桨(PaddlePaddle)由百度公司开发,是目前国内唯一功能完备的端到端开源深度学习平台,集深度学习训练和预测框架、模型库、工具组件、服务平台为一体,其兼具灵活和效率的开发机制、工业级应用效果的模型、超大规模并行深度学习能力、推理引擎一体化设计以及系统化的服务支持,致力于让深度学习技术的创新与应用更简单。
    本项目的paddle/fluid/operators/optimizers目录中包含了常见的优化器(如,Momentum,Adam等等)的c++实现。

    标注任务

    标注../fluid/operators/optimizers/目录下的所有代码文件

    经典算法解读:

    点击进入代标注模块

  • Python项目

    PaddlePaddle网络结构

    项目简介

    飞桨(PaddlePaddle)由百度公司开发,是目前国内唯一功能完备的端到端开源深度学习平台,集深度学习训练和预测框架、模型库、工具组件、服务平台为一体,其兼具灵活和效率的开发机制、工业级应用效果的模型、超大规模并行深度学习能力、推理引擎一体化设计以及系统化的服务支持,致力于让深度学习技术的创新与应用更简单。
    本项目的python/paddle/fluid/layers/nn.py中包含了神经网络中大量常见层和操作符的python实现,如fc、conv、gru等等。

    标注任务

    标注../paddle/fluid/layers/nn.py代码文件

    经典算法解读:

    点击进入代标注模块