AI

10个学习Python的理由

如果你是本博客的读者,那么你可能想知道我为什么要写一篇博客来告诉人们在Java博客中学习Python?几年前我不是说更喜欢Java而不是Python吗?现在,事情发生了很大的变化。2016年,Python取代Java成为大学中最受欢迎的语言,从那时起它就再也没有回来了。Python正在不断发展壮大。如果你阅读编程和技术新闻或博客文章,那么你可能已经注意到Python的兴起,因为许多流行的开发人员社区,包括StackOverflow和CodeAcademy都提到了Python作为主要编程语言的兴起。  但是,最大的问题是为什么程序员应该学习Python?Python正在发展中,这很好,但这并不意味着Java或C ++正在被淘汰。 好吧,我是一个自豪的Java开发人员,它是我最喜欢的编程语言,并且一直保持着,但是,这并不能阻止我们学习潜在的新工具和编程语言,这将使你成为一个更好的程序员,Python就是这种。  初学者从Python开始理由很简单,因为它易于学习,功能强大,足以构建Web应用程序并自动化枯燥无聊的东西。  实际上,几年前,

  • yhblog
10 min read
AI

使用Gensim进行主题建模(二)

​在上一篇文章中,我们将使用Mallet版本的LDA算法对此模型进行改进,然后我们将重点介绍如何在给定任何大型文本语料库的情况下获得最佳主题数。16.构建LDA Mallet模型到目前为止,您已经看到了Gensim内置的LDA算法版本。然而,Mallet的版本通常会提供更高质量的主题。Gensim提供了一个包装器,用于在Gensim内部实现Mallet的LDA。您只需要下载 zip 文件,解压缩它并在解压缩的目录中提供mallet的路径。看看我在下面如何做到这一点。gensim.models.wrappers.LdaMallet# Download File: http://mallet.cs.umass.edu/dist/mallet-2.0.8.zipmallet_path

  • yhblog
8 min read
AI

使用Gensim进行主题建模(一)

主题建模是一种从大量文本中提取隐藏主题的技术。Latent Dirichlet Allocation(LDA)是一种流行的主题建模算法,在Python的Gensim包中具有出色的实现。然而,挑战在于如何提取清晰,隔离和有意义的高质量主题。这在很大程度上取决于文本预处理的质量以及找到最佳主题数量的策略。本教程试图解决这两个问题。内容1.简介2.先决条件 - 下载nltk停用词和spacy模型3.导入包4. LDA做什么?5.准备停用词6.导入新闻组数据7.删除电子邮件和换行符8.标记单词和清理文本9.创建Bigram和Trigram模型10.删除停用词,制作双字母组合词和词形变换11.创建所需的词典和语料库主题建模12.构建主题模型13.查看LDA模型中的主题14.计算模型复杂度和一致性得分15.可视化主题 -

  • yhblog
15 min read
AI

人工智能:每个人都应该知道的!

照片由Lukas在Unsplash上拍摄 人工智能:每个人都应该知道的! 什么是人工智能?它是干什么用的? Rafael Cordeiro封锁UnblockFollow继3月9日 人工智能是一个受到很多关注的话题,主要是因为该领域的快速改进。如今的惊人创新,为医学研究甚至飞行汽车等惊人成就奠定了基础。在本文中,我将重点关注3个特定主题: "什么是人工智能?" 在这个主题上,我将讨论和解释什么是人工智能,它正在被用于什么,我将举一些它将来使用的例子。 机器学习, 在这里我将解释这个奇怪的主题是什么以及与AI的联系是什么。此外,我将举一个小例子o机器学习在行动! 飞行汽车(复活节EGG), 为了好玩,并讨论AI实施的近乎可能性,我将讨论飞行汽车的未来以及它们今天的发展情况。 什么是人工智能? 早在20世纪50年代,明斯基和麦卡锡领域的父亲就将人工智能描述为程序或机器执行的任何任务,如果人类执行相同的活动,

  • yhblog
7 min read
AI

如何撰写通过人工智能测试的简历

如何撰写通过人工智能测试的简历 今天,你的简历不仅要讲述一个关于你职业生涯的引人入胜的故事,还要通过AI测试才能继续前进 Forbes BlockedUnblockFollow关注3月25日 照片:Quarta_ / iStock / Getty Images Plus 凯西卡普里诺 在我作为女性职业,执行和领导力教练的工作中,我们经常参与开发更强大的简历和LinkedIn概况的过程,以及确定网络和申请代表重大进步的顶级角色的策略。生长。 经常出现的一个问题与人工智能在筛选简历中的作用有关,以及候选人如何制作一份能够通过机器人和系统进入人手的简历。 为了更多地了解这一点,我采访了Sparks Research的首席情报官Jon Christiansen博士 ,该公司负责进行一级市场研究和商业智能,以帮助高管在其业务模式的所有领域做出数据驱动的决策,招聘和入职,客户服务和产品定价。 克里斯蒂安森为银行,汽车,零售,医疗保健和能源行业的财富500强企业提供服务,仅举几例。

  • yhblog
11 min read
AI

一项新的研究表明,人工智能在卫生保健方面有用

一项新的研究表明,人工智能在卫生保健方面有用 研究人员使用机器视觉来帮助护士监测ICU患者。他们接近工作的方式显示了询问人们真正需要人工智能的价值。 麻省理工学院技术评论 BlockedUnblockFollow继3月26日 照片:Martin Barraud / Caiaimage / OJO + / Getty Images 作者:Karen Hao 医院重症监护病房可能是病人的可怕场所。并且有充分的理由。在美国,ICU的死亡率高于其他任何医院单位 - 在8%至19%之间,每年约有500,000人死亡。那些没有死的人可能会以其他方式受到影响,例如长期的身体和精神障碍。对于护士而言,在一个人中工作很容易导致倦怠,因为它需要如此多的身体和情感耐力来管理全天候的护理。 现在发表在Nature Digital

  • yhblog
7 min read
AI

加里卡斯帕罗夫说AI可以让我们更加人性化

加里卡斯帕罗夫说AI可以让我们更加人性化 PCMag BlockedUnblockFollow发布于3月26日 "这不是打开地狱的大门,但它不是天堂,"卡斯帕罗夫谈到人工智能。人工智能从我们这里学习,所以我们应该真的害怕坏演员,而不是杀手机器人。 由 丹哥斯达 加里卡斯帕罗夫是人工智能自动化革命的首批受害者之一。他输给IBM的Deep Blue使他成为第一个失去电脑配对的人类象棋冠军。但卡斯帕罗夫并不厌倦;他的书Deep Thinking ,探讨了人工智能如何能够真正帮助我们变得更加人性化。 卡斯帕罗夫本月早些时候在奥斯汀的SXSW告诉我,真正的挑战是将这些工具与想要用它们造成伤害的人保持一致。在这方面,我们可能已经太晚了。 丹·科斯塔:在下棋和与深蓝战斗之后,你从此成为了各种各样的象棋AI专家。您希望人们如何理解人工智能? 加里卡斯帕罗夫 :我必须承认我知道我无知的极限。这就是为什么我很乐意谈论我对自己的专业知识充满信心的事情,而且我认为我对人机关系有一定的了解,

  • yhblog
20 min read
AI

关于自学机器学习的思考?提醒自己这6件事

我们在澳大利亚举办了一个机器人会议,现在是提问时间。有人问了一个问题。“我如何从不同的背景进入人工智能和机器学习?”尼克转身叫了我的名字。“丹·伯克在哪里?”我在后台与Alex交谈。我走了过来。“他在这里,”尼克继续道,“丹是保健科学背景,他研究营养学,然后驾驶Uber,在网上学习机器学习,现在已经是Max Kelsen一年的机器学习工程师。”尼克是Brisbane科技公司Max Kelsen的首席执行官兼联合创始人。我站着一直听着。“他在网上记录了他的旅程,如果你有任何问题,我相信他会很乐意帮忙的。”问题解决了,我又回到了食物上。Ankit过来了。他告诉我他正在努力利用机器学习来理解学生学习的更好。他将讲座出勤率,在线学习门户上花费的时间,测验结果以及其他一些内容结合起来。他甚至建立了一个前端门户网站来与结果进行交互。Ankit的作品激发了我的灵感。这让我想做得更好。

  • yhblog
6 min read
精选

如何撰写通过人工智能测试的简历

如何撰写通过人工智能测试的简历 今天,你的简历不仅要讲述一个关于你职业生涯的引人入胜的故事,还要通过AI测试才能继续前进 Forbes BlockedUnblockFollow关注3月25日 照片:Quarta_ / iStock / Getty Images Plus 凯西卡普里诺 在我作为女性职业,执行和领导力教练的工作中,我们经常参与开发更强大的简历和LinkedIn概况的过程,以及确定网络和申请代表重大进步的顶级角色的策略。生长。 经常出现的一个问题与人工智能在筛选简历中的作用有关,以及候选人如何制作一份能够通过机器人和系统进入人手的简历。 为了更多地了解这一点,我采访了Sparks Research的首席情报官Jon Christiansen博士 ,该公司负责进行一级市场研究和商业智能,以帮助高管在其业务模式的所有领域做出数据驱动的决策,招聘和入职,客户服务和产品定价。 克里斯蒂安森为银行,汽车,零售,医疗保健和能源行业的财富500强企业提供服务,仅举几例。

  • yhblog
11 min read
AI

使用Facebook的FastText简化文本分类

使用FastText API分析亚马逊产品评论情绪的分步教程本博客提供了详细的分步教程,以便使用FastText进行文本分类。为此,我们选择在Amazon.com上对客户评论进行情绪分析,并详细说明如何抓取特定产品的评论以便对他们进行情绪分析。什么是FastText?文本分类已成为商业世界的重要组成部分; 是否用于垃圾邮件过滤或分析电子商务网站的推特客户评论的情绪,这可能是最普遍的例子。FastText是由Facebook AI Research(FAIR)开发的开源库,专门用于简化文本分类。FastText能够在几十分钟内通过多核CPU在数百万个示例文本数据上进行训练,并使用训练模型在不到五分钟的时间内对超过300,000个类别中的未出现的文本进行预测。预先标注的训练数据集:收集了从Kaggle.com获得的包含数百万条亚马逊评论的手动注释数据集,并在转换为FastText格式后用于训练模型。FastText的数据格式如下:__label__<X> __label__<Y>

  • yhblog
8 min read
AI

使用Gensim实现Word2Vec和FastText词嵌入

在自然语言处理(NLP)中,我们经常将词映射到包含数值的向量中,以便机器可以理解它。词嵌入是一种映射,允许具有相似含义的单词具有相似的表示。本文将介绍两种最先进的词嵌入方法,Word2Vec和FastText以及它们在Gensim中的实现。传统方法表示单词的传统方式是单热(one-hot)向量,其本质上是仅具有一个元素为1且其他为0的向量。向量的长度等于语料库中的总唯一词汇(去重后)的大小。通常,这些独特的单词按字母顺序编码。也就是说,你应该希望one-hot向量用于表示以“a”开头的单词,其中“1”的索引较低,而以“z”开头的那些单词,“1”的索引较高。虽然这种单词表示简单易行,但存在一些问题。首先,

  • yhblog
9 min read
AI

深入浅出学习决策树(二)

接着上篇文章 深入浅出学习决策树(一) 继续介绍决策树相关内容。回归问题中的决策树在预测数值变量时,构造树的想法保持不变,但质量标准会发生变化。其中n是叶子中的样本数,Yi是目标变量的值。简单地说,通过最小化均值周围的方差,我们寻找以这样的方式划分训练集的特征,即每个叶子中的目标特征的值大致相等。例让我们生成一些由函数分配并带有一些噪音的数据。然后我们将在其上训练一棵树并显示它所做的预测。 n_train = 150 n_test = 1000 noise = 0.1 def f(x): x = x.ravel() return np.exp(

  • yhblog
21 min read
AI

随机森林算法

随机森林是一种灵活,易于使用的机器学习算法,即使没有超参数调整,也能在大多数情况下产生出色的结果。它也是最常用的算法之一,因为它简单,并且可以用于分类和回归任务。在这篇文章中,您将学习随机森林算法如何工作以及其他几个重要的事情。目录:这个怎么运作 真实生活类比特征重要性决策树与随机森林的区别重要的超参数(预测能力,速度)优点和缺点用例摘要这个怎么运作:随机森林是一种监督学习算法。就像你已经从它的名字中看到的一样,它创造了一个森林,并使它在某种程度上是随机的。它构建的“森林”是决策树的集合,大部分时间都是用“装袋”方法训练的。装袋方法的一般思想是学习模型的组合增加了整体结果。用简单的话来说:随机森林构建多个决策树并将它们合并在一起以获得更准确和稳定的预测。随机森林的一大优势是,它可以用于分类和回归问题,这些问题构成了当前机器学习系统的大部分。我将在分类中讨论随机森林,因为分类有时被认为是机器学习的基石。

  • yhblog
11 min read
AI

解释Logistic回归背后的直觉

(注意:这是一篇试图向不完全熟悉统计数据的读者解释Logistic回归背后的直觉的帖子。因此,你可能在这里找不到任何严谨的数学工作。)Logistic回归是一种涉及线性判别的分类算法。那是什么意思?1.与实测回归法不同,逻辑回归不会尝试在给定一组输入的情况下预测数值变量的值。相反,输出是给定输入点属于某个类的概率。为简单起见,假设我们只有两个类(对于多类问题,您可以查看多项Logistic回归),并且所讨论的概率是P+ - >某个数据点属于' +'类的概率。当然,P_ =1-P+。因此,Logistic回归的输出总是在[0,1]中。2. Logistic回归的核心前提是假设您的输入空间可以被分成两个不错的“区域”,每个类对应一个线性(读取:

  • yhblog
8 min read
AI

如何解决90%的NLP问题:逐步指导

无论您是成熟公司还是致力于推出新服务,您始终可以利用文本数据来验证,改进和扩展产品的功能。从文本数据中提取意义和学习的科学是一个活跃的研究主题,称为自然语言处理(NLP)。 每天NLP产生新的和令人兴奋的 结果,是一个非常大的领域。然而,Insight团队与数百家公司合作,看到一些关键的实际应用程序比其他任何公司更频繁地出现: 识别不同的用户/客户群(例如预测流失,生命周期价值,产品偏好) 准确地检测和提取不同类别的反馈(正面和负面评论/意见,提及特定属性,如服装尺码/合身......) 根据意图对文本进行分类(例如请求基本帮助,紧急问题)

  • yhblog
19 min read
AI

使用CNN,RNN和HAN进行文本分类的对比报告

介绍你好,世界!!我最近加入Jatana.ai 担任NLP研究员(实习生and),并被要求使用深度学习模型研究文本分类用例。在本文中,我将分享我的经验和学习,同时尝试各种神经网络架构。我将介绍3种主要算法,例如:卷积神经网络(CNN)递归神经网络(RNN)分层注意网络(HAN)对具有丹麦语,意大利语,德语,英语和土耳其语的数据集进行文本分类。我们来吧。✅关于自然语言处理(NLP)在不同业务问题中广泛使用的自然语言处理和监督机器学习(ML)任务之一是“文本分类”,它是监督机器学习任务的一个例子,因为包含文本文档及其标签的标记数据集用于训练分类器。文本分类的目标是自动将文本文档分类为一个或多个预定义类别。文本分类的一些示例是:

  • yhblog
11 min read
AI

关于人工智能-微软和谷歌没有告诉你的是什么

点击英文原文链接人工智能到底有多少是人工的,多少是手工的?2018年9月,iFlytek,一家中国技术公司,人工智能的全球领导者(尤其是语音识别软件)在上海举行的技术会议上被指责将人工翻译伪装成机器翻译。举报人是Bell Wang,他正在会议上进行现场翻译。他注意到iFlytek在公司品牌标识旁边的屏幕上使用他的翻译作为实时字幕。这表明翻译后的输出是由他们的AI系统产生的,而不是由Wang产生的。该公司还使用计算机合成的语音在线直播,而不是原始的人类口译员的声音。Wang将照片和视频作为证据。然后,他将他们发布到中国博客平台知乎,并指控iFlytek欺诈。这引发了媒体的 狂热和对iFlytek公关和营销策略的争论。该公司声称已开发出尖端技术 - 但Wang的报告对这一切提出了质疑。您可能没有听说过iFlytek。2017年,麻省理工学院技术评论将其评为全球“第六最聪明的公司” - 排名最高的中国公司,仅次于谷歌,但高于英特尔(

  • yhblog
7 min read
AI

神经网络似乎遵循一种令人费解的简单策略来对图像进行分类

点击英文原文链接CNN非常擅长对乱序图像进行分类,但人类并非如此。在这篇文章中,我将展示为什么最先进的深度神经网络仍能很好地识别乱码图像,以及这有助于揭示DNN似乎用来对自然图像进行分类的令人费解的简单策略。这些发现发表在ICLR 2019,有许多分歧:首先,它们表明解决ImageNet比许多人想象的要简单得多。其次,这些发现使我们能够构建更具解释性和透明度的图像分类流水线。第三,他们解释了现代CNN中观察到的一些现象,例如他们对纹理的偏见(参见我们在ICLR 2019的另一篇论文和我们相应的博客文章)以及他们忽略了对象部分的空间排序。好的ol'特色包模型在过去,在深度学习之前,自然图像中的对象识别过去相当简单:定义一组关键视觉特征(“单词”),识别每个视觉特征在图像中的存在频率(“包”)和然后根据这些数字对图像进行分类。因此,这些模型被称为“特征包”模型(BoF模型)。举例来说,我们只有两个视觉特征,

  • yhblog
10 min read

Subscribe to 银河系技术日报

旨在发现全球技术深度好文,拒绝热点浮躁浅文,对于外文,受限于鄙人英语水平和效率,都采用AI机器翻译,如果觉得翻译不好,可以直接看原文。 希望对大家有启发帮助。