编程

相对不常见,但非常有用的Python技巧

​交换变量值​将一列表中的所有元素拼接成字符串查找list中最高频率的值检查两个单词是否是字谜(组成的字母和对应数量一致)反转字符串反转列表转置2维数组链式比较链式函数调用复制列表Dictionary Get按值排序字典For Else将列表转换为逗号分隔的字符串合并字典list中的最小和最大索引从列表中删除重复项查看英文原文查看更多文章公众号:银河系1号联系邮箱:public@space-explore.com(未经同意,请勿转载)

  • yhblog
2 min read
AI

使用Gensim进行主题建模(一)

主题建模是一种从大量文本中提取隐藏主题的技术。Latent Dirichlet Allocation(LDA)是一种流行的主题建模算法,在Python的Gensim包中具有出色的实现。然而,挑战在于如何提取清晰,隔离和有意义的高质量主题。这在很大程度上取决于文本预处理的质量以及找到最佳主题数量的策略。本教程试图解决这两个问题。内容1.简介2.先决条件 - 下载nltk停用词和spacy模型3.导入包4. LDA做什么?5.准备停用词6.导入新闻组数据7.删除电子邮件和换行符8.标记单词和清理文本9.创建Bigram和Trigram模型10.删除停用词,制作双字母组合词和词形变换11.创建所需的词典和语料库主题建模12.构建主题模型13.查看LDA模型中的主题14.计算模型复杂度和一致性得分15.可视化主题 -

  • yhblog
15 min read
编程

一份python实用”技巧“清单(按字母顺序)

Python是世界上最受欢迎,最流行的编程语言之一。这有很多原因:它很容易学习它是超级多用途的它有大量的模块和库作为数据科学家的我,每天使用Python是我内在工作的一部分。在这个过程中,我学会了一些有用的技巧和心得。在这里,我尝试以A~Z顺序共享其中一些。大多数这些“技巧”是我在日常工作中使用或偶然发现的事情。一些是我在浏览Python标准库文档时发现的。另外一些是通过PyPi搜索到的。但是,应该归功于它 - 我在awesome-python.com上发现了其中的四个或五个。这是数百个有趣的Python工具和模块的精选列表。这是值得浏览的灵感!all or anyPython是如此流行的编程语言的原因之一是因为具有可读性和表现力。人们经常开玩笑说Python是' 可执行的伪代码 '。但是当你可以编写这样的代码时,很难反驳:x = [True, True,

  • yhblog
12 min read
编程

Java XML和JSON:Java SE的文档处理 第2部分

在这篇文章中,我们将继续探索Java 11及更高版本中的XML和JSON。本文中的示例将向您介绍JSON-B,JSON绑定API for Java。在快速概述和安装说明之后,我将向您展示如何使用JSON-B来序列化和反序列化Java对象,数组和集合; 如何使用JSON-B自定义序列化和反序列化; 以及如何在序列化或反序列化期间使用JSON-B适配器将源对象转换为目标对象。这篇文章的材料是全新的,但可以被认为是我的新书的另一章(第13章),最近由Apress出版:Java XML和JSON,第二版。什么是JSON-B?JSON-B是一个标准的绑定层和API,用于将Java对象与JSON文档进行转换。它类似于XML绑定的Java体系结构(JAXB),它用于将Java对象转换为XML或从XML转换成Java对象。JSON-B构建于JSON-P之上,JSON-P是用于解析,生成,查询和转换JSON文档的JSON处理API。JSON-B是由Java规范请求(JSR)367在JSR 353(

  • yhblog
16 min read
编程

Java XML和JSON:Java SE的文档处理,第1部分

XML和JSON对我很重要,我很感谢Apress允许我写一本关于它们的书。在这篇Java Q&A文章中,我将简要介绍我的新书第二版,Java XML和JSON。我还将提供两个有用的演示,如果我有足够的空间,我本来希望将其包括在书中。首先,我将向您展示如何覆盖Xalan,它是Java 11的标准XSLT实现,具有XSLT 2.0+和XPath 2.0 +兼容的替代方案,在本例中为SAXON。使用SAXON for XSLT / XPath可以更轻松地访问分组等功能,我还将演示。接下来,我将向您展示使用Jackson将XML转换为JSON的两种方法:第一种技术是数据绑定,第二种是树遍历。为什么选择XML和JSON?

  • yhblog
18 min read
编程

选择Java IDE

每个Java开发人员都需要一个编程编辑器或IDE,它可以帮助编写Java和使用类库和框架的更多部分。确定最适合您的编辑器或IDE取决于几个方面,包括正在开发的项目的性质,您在组织中的角色,开发团队使用的过程以及您作为程序员的级别和技能。其他考虑因素是团队是否已对工具进行标准化以及您的个人偏好。最常用于服务器端Java开发的三个IDE是IntelliJ IDEA,Eclipse和NetBeans。但是,这些并不是唯一的选择,本综述还将包括一些轻量级IDE。对于本综述,我在Mac上为Intelli EE IDEA Ultimate 2018.3,Eclipse IDE 2018-09(用于Java EE开发人员)和Apache NetBeans(孵化)IDE 9进行了全新安装。我还查看了几个开源Java项目,以便我可以测试相同项目中的所有IDE。基础知识:

  • yhblog
22 min read
编程

为什么大多数Scrum Masters注定会失败

为什么大多数Scrum Masters注定会失败 Maarten Dalmijn BlockedUnblockFollow关注3月25日 如果您已经在公司看到过Scrum,那么您之前可能已经看过了。该公司从Scrum开始,突然需要一个Scrum Master。 该公司询问想成为Scrum Master的团队。开发团队的勇敢成员向前迈进,并说: "我会做到的" 。 有勇气拿起手套是一回事,准备接受这个角色是另一回事。 通常这个人不知道他或她正在接受什么。充其量,志愿者正在崎岖不平。在最坏的情况下,这个人注定要失败,完全没有准备好扮演Scrum Master的角色。 现在想象一下开发团队很幸运,前进的人很了解Scrum。刚刚铸造的Scrum Master是否能够成功? 对Scrum的深刻理解是不够的 想象一下,你是一个伟大的钢琴演奏家。

  • yhblog
6 min read
编程

ML云计算第2部分:将PyCharm连接到Paperspace

ML云计算第2部分:将PyCharm连接到Paperspace Bryan Pratte BlockedUnblockFollow关注3月28日 使用远程解释器设置PyCharm项目 尽管我喜欢终端,但我仍然非常相信GUI工具。我宁愿在日常开发工作流程中最小化任何命令行的暴露量。说实话,这是我对终端,SSH和本地主机的ML工作流状态最大的困惑之一。我看到许多人使用文本编辑器并使用命令行执行来运行他们的代码。移动开发者被Android Studio和XCode宠坏了,ML开发者应该拥有同样的奢侈品。 幸运的是,有一个可爱的python IDE叫做PyCharm。它基本上是XCode,但对于所有事情python,它恰好是所有事物的最常见的语言接口ML :)更大的好处是PyCharm具有远程连接到服务器并远程运行代码的内置功能。控制台,日志,调试器和绘图都可以正常工作。 第0步: 设置Paperspace机器: 如果您还没有完成设置Paperspace的第1部分,可以在此处找到它。 第1步: 下载并安装PyCharm Set:

  • yhblog
7 min read
编程

程序员创建折衷书架的指南

程序员创建折衷书架的指南 Collin Rusk BlockedUnblockFollow关注3月24日 这张照片由德国Poo-Carmano拍摄 每个开发人员都应该有一个书架。他内阁中可能的文本集是无数的,但并非每个集合都为程序员提供了各种工具。使用不拘一格的武器,开发人员可以从多个角度攻击问题。通过多样化的书架,这种混合方法成为可能。下面列出的作品提供各种衣柜。 概观 本节的书籍提供了开发人员标准工具包中技术的鸟瞰图。 代码完成 Steve McConnell的Code Complete概述了程序员的基本工具箱。该工作台包括规划,设计,编码和QA。 McConnell给出了这些主题和其他主题。他的草图为许多科目提供了最佳实践。 Code Complete中的建议和概要构成了开发人员的标准工具包。 软件工程的事实与谬误 Robert Glass的" 软件工程的事实和谬误"是针对常见工作台的案例集合。

  • yhblog
14 min read
编程

正则表达式教程 - 通过示例快速备忘单

正则表达式教程---通过示例快速备忘单 Jonny Fox封锁UnblockFollow 2017年6月22日 UPDATE! 查看我的新REGEX COOKBOOK,了解最常用(和最想要的)正则表达式🎉 正则表达式(regex或regexp)通过搜索特定搜索模式的一个或多个匹配(即ASCII或unicode字符的特定序列) 从任何文本 中 提取信息 非常有用。 应用领域从验证到解析/替换字符串,将数据转换为其他格式和网页抓取。 最有趣的特性之一是,一旦你学会了语法,你几乎可以在(几乎)所有编程语言中使用这个工具(JavaScript,Java,VB,C#,C / C ++,Python,

  • yhblog
4 min read
编程

为什么我不进行代码审核

圣海伦山,躲在云端 为什么我不进行代码审核 这并不意味着它们没用 Eric Higgins封锁UnblockFollow继2018年10月15日之后 我之前写过关于我认为安全文化很重要的原因 。在那篇文章中,我提到我的一些客户对我不审核他们的产品代码感到惊讶。以下是三个原因: 攻击者认为更大 产品软件中的潜在缺陷并不是威胁参与者的唯一机会。它们会攻击更简单的目标,例如开发人员工具或构建服务器。这些提供了令人难以置信的访问级别,并且不太可能得到保护和监控。将安全计划集中在组织的运作方式而不仅仅是代码上,将有助于您捕捉这些其他风险因素。 未知的未知数 研究人员尽最大努力了解您的产品如何运作, 并 在很短的时间内寻找潜在的问题。不要紧,他们 怎么 许多问题发现,还是有东西从他们 没有 发现的风险。监控异常事件可以更好地检测意外行为,未检测到的问题,并帮助您在晚上睡觉。 软件永远不会完成

  • yhblog
3 min read
编程

解析大数问题 - Python

解析大数问题 大家好,我正在写一些简单的代码来提高功率的基值 然后对输出执行一些操作。我已经包含了我的代码 现在使用,在下面(请参阅此消息的结尾),也可以在下面看到 当我从控制台运行脚本时,这看起来像什么; ......................................... C:\ PYTHON34> python tst.py 输入值:431.1 输入功率值; 1.9907 结果1739.554505641426658257842063903808593750000000000 000000000000000 ......................................... 我需要做什么; 1.)将整数值存储到小数点左边,不带小数 变量= x 2.

  • yhblog
3 min read
编程

使用Neo4j和Java进行大数据分析 第2部分

本文的第一部分介绍了Neo4j及其Cypher查询语言。如果您已经阅读了第1部分,那么您已经了解了为什么Neo4j和其他图形数据库特别受社交图形或网络中用户之间关系建模的影响。您还在开发环境中安装了Neo4j,并概述了使用此数据存储的基本概念 - 即节点和关系。然后,我们使用Cypher查询语言对Neo4j中的一个家庭进行建模,包括年龄,性别和家庭成员之间的关系等个人属性。我们创建了一些朋友来扩大我们的社交图,然后添加键/值对来生成每个用户看过的电影列表。最后,我们查询了我们的数据,使用图形分析来搜索一个用户没有看到但可能喜欢的电影。Cypher查询语言与SQL等传统数据查询语言不同。Cypher并没有考虑像表和外键关系这样的事情,而是强迫您考虑节点,节点之间的自然关系以及各个节点之间可以在各个关系之间进行的各种遍历。使用Cypher,您可以创建自己的心理模型,了解真实世界的实体如何相互关联。需要一些练习来擅长编写Cypher查询,但是一旦你理解了它们的工作方式,即使非常复杂的查询也是有意义的。在使用Cypher查询语言对Neo4j中的社交图建模并使用该社交图编写查询后,编写Java代码以对该图执行查询非常简单。在本文中,您将学习如何将Neo4j与Java Web客户端应用程序集成,您可以使用它来查询我们在第1部分中创建的社交图。

  • yhblog
14 min read

Subscribe to 银河系技术日报

旨在发现全球技术深度好文,拒绝热点浮躁浅文,对于外文,受限于鄙人英语水平和效率,都采用AI机器翻译,如果觉得翻译不好,可以直接看原文。 希望对大家有启发帮助。