命令行+虚拟机 代理设置方案汇总
这里总结了 macOS 环境下命令行代理配置方案,使用的代理软件是 ClashX 不过应该对于大多数代理软件都是可以的;还介绍了 VMware 中的 Ubuntu 虚拟机的系统和命令行代理方式。
对于 Windows 虚拟机来说,实现系统代理的方法和 Ubuntu 是类似的,对于 Windows 环境下的命令行代理方式,可参考 给 Windows 的终端配置代理 一文;用不来 Windows 就不去尝试了。
VMware 虚拟机代理设置
【20201101 更新:一直以来也被虚拟机如何使用代理的问题搞得很头痛,最近突然想通了,总结如下。】
这篇 文章 介绍了在 VMware 上的 Ubuntu 的系统代理配置方法。
先在本机上使用 ifconfig (win 下则是 ipconfig /all)查看VMware 生成的虚拟网卡,名字一般是 vmnet1 等形式,记下它的地址;
在宿主机上的代理软件中打开「允许来自局域网的连接」选项,记住端口号,例如在 ClashR 中的 HTTP/Socks5 的混合端口号为 7890;
打开虚拟机,在网络设置中直接可以配置系统带来,将不同协议 ...
个人日志笔记软件比较
test description here
Windows To Go 安装记录
说起来又是一个很长的故事,反正结果就是又花了一个周末的时间折腾了 Windows To Go,最终顺利安装好了,中间遇到了挺多的坑,总结如下。
安装
最开始用的教程是这个 https://sspai.com/post/44699 ,不过里面很大的一个坑就是,苹果 T2 安全芯片的问题在该文中从始至终没有提到,导致我失败了很多次。
最后几乎走投无路了,在同学的帮助下找到了这篇文章 mac-Windows to go安装(带Parallel虚拟机引导全过程) ;才发现是 T2 芯片的锅。
T2安全芯片
可以 按住「Option」时点左上角苹果标志,在「System Information」(当然也可以通过 Spotlight 搜索打开该工具)中的「Hardware-Controller」中查看是否有 T2 芯片;一般带指纹解锁的都是有的;
解锁的方式的,开机时长按「Command+R」进入 Recovery 模式,在「实用工具」中打开「启动安全性实用工具」,「安全启动」设置为 无安全性,「外部启动」设置 允许
关于这一步的话,我之前试了很多次重启之后又回到「完整安全性」选项,不知道是否是 ...
Joplin 尝试 & 资源汇总
【汇总了之前学习 Joplin 阶段用到的一些技巧和资源,并记录了使用一段时间后的感想。】
20201025 更新:目前已经使用 Joplin 一段时间了,也与其他的笔记软件进行了一些比较,目前的使用小结如下:总体而言,Joplin 取代了之前 Evernote 的地位——作为信息采集端的 APP,原因如下
相较于 Evernote 有着更为开放的 API,全平台免费非常良心(主要是因为贫穷);
更重要的原因自然是本地化存储,不会因为网络原因出现卡顿;
支持 WebDAV,配合 NAS(或者坚果云)使用同步很棒;
原本的界面一般,更新到现在已经非常好看了(1.2.6)(吐槽一下,Joplin 的更新较为频繁而且时不时会跳出来,虽然是好事但次数多了还是有些厌烦的);
对于 Markdown 的支持更好,当然其和 Evernote 的定位完全不一样,当相对于 Evernote 的「大而全」来说 Joplin 的「小而精」的定位,至少对于我来说是体验更棒的;
另外,最近在尝试使用 DEVONthink,有被惊艳到,但其网页剪辑为 HTML 好像没有将图片资源一起下载下来,保存成其他格式 ...
数据可视化 Note
1 数据
数据属性特征
数据值类别
Nominal (labels)
Ordinal (ordered)
Interval (location of zero arbitrary)
Ratio (zero fixed)
注意区分区间型和比值型,后者可以定义乘除法
属性间的距离
比值型下的各种定义
数据预处理
缺失值
噪声值:回归分析、离群点分析
可视化数据清洗
数据整合:多数据源
数据存储
文件形式:CSV、HTML、XML
数据库
数据仓库 data warehouse
2.0 Image 图像
从图像到数字图像
天文、医学……
采样 sampling
量化 quantization
分辨率
Radiometric resolution 量化的大小
Geometric resolution 通常意义下的分辨率
Image resolution 图片尺寸
存储形式
数字图像表达:\(f(X)=Y\)
Pixel
Coordinates
Gray level
亮度和对比度
视觉:brightness adaptation level
Weber r ...
社交网络挖掘-Note3
9-用户行为分析 Behavior Analytics
目标是:To analyze, model, and predict individual and collective behavior
个体行为分析
对于一个用户行为分析,我们需要:可观测的行为、一些特征、发现他们之间的相关性、以及如何度量这些模型。
原 PPT 上介绍了一下格兰杰因果检验,没学过时间序列不太了解 Orz
个体行为建模
个体行为预测
上面的三种个体行为分类,其实都可以看作是一个 链路预测问题。
大体上可以分为两类:一类基于两个节点之前的相似性,一类基于两个节点之间的路径特征。
Node Neighborhood-Based Methods
可以根据 node 之间的相似性来度量,下面枚举了一些结构等价性(基于邻居节点的关系)的度量指标
Path-Based Measures
这里给出了一些思路:一是考虑两个节点之间的路径长度,按照路径的长度指数衰减;二是考虑随机游走,计算从一个节点随机游走到另一个节点的概率
机器学习方法
当然,连接预测的问题等价于一个二分类问题,可以采用一些经典的分类模型:决策树 ...
社交网络挖掘-Note2
5-数据挖掘概论
两大派别
计算机科学家
认为机器学习是人工智能的一个重要分支,机器学习作为实现人工智能的一个重要途径
统计学家
往往认为机器学习就是统计学习,是统计学中偏向应用的一个分支,对统计学习之外的手段(基于代数的、逻辑的、几何的学习等)会比较排斥
三大流派
符号主义
又称逻辑主义、心理学派或计算机学,其原理主要为物理符号系统(即符号操作系统)假设和有限性原理。符号主义者最早在1956年首先提出了“人工智能”术语,又发展了启发式算法-专家系统-知识工程理论与技术,并在20世纪80年代取得很大发展,代表人物纽厄尔、西蒙等。
连接主义(联结主义)
又称为结构主义、仿生学派或生理学派,主要原理为神经网络及神经网络间的连接机制与学习算法。代表性成果是1943年由生理学家麦卡洛克和数理逻辑学家皮茨创立的脑模型,60-70年代出现的以感知机为代表的脑模型研究,1986年鲁梅哈特等人提出多层网络中的反向传播算法(BP)。
行为主义
又称为进化主义或控制论学派,其原理为控制论即感知-动作型控制系统。控制论把神经网络系统的工作原理与信息理论、控制理论、逻辑以及计算机联系起 ...
社交网络挖掘-Note1
1-概论
从社会的角度去分析和理解个人的行为。
“人的本质并不是单个人所固有的抽象物。在 其现实性上,它是一切社会关系的总和”——马克思《关于费尔巴哈的提纲》
“社会不是由个人构成,而是表示这些个人彼 此发生的那些联系和关系的总和”—— 《马克思恩格斯全集》V.46, P.220, 人民出版社, 1979年
相关应用
精准营销:用户画像、个性化推荐、社会化营销
舆情管理:危机预警、观点挖掘、情感分析
分析预测:市场研判、新闻热点预测、用户行为画像与预测
刑侦反恐:潜在关系挖掘、犯罪社团挖掘
用的教材主要是《社会媒体挖掘》一书,英文版 PDF 和 Slides 见 http://dmml.asu.edu/smm/
主要内容包括
图论基础
网络度量:网络权威/中心用户查找
网络挖掘:小世界现象
数据挖掘:社区(团)挖掘
社交网络的信息传播:影响力最大化、热门话题预测
影响力和同质性
用户行为分析:网络学、社会学、经济学、博弈论
推荐系统
参考书目
• 《社会媒体挖掘》,Reza Zafarani等
• 《网络、群体与市场》,⼤卫·伊斯科,乔恩·克莱因伯格
• 《Pajek蜘蛛 ...
Markdown 新解决方案:Typora+本地备份+GitHub 图床
Typora编辑+图片本地备份+GitHub图床
回想一下自己接触 Markdown 已经有一年多了,在这段时间内也感觉到自己到前往码农的道路上飞奔着,MD 以其简洁、优雅、精准让我放弃了几乎其他所有的记录方案,成为自己的主要输出形式。
当然在这一过程中,自己也面临着一些问题,其中最主要的就是对于图片的处理,这里给出了 本地备份+GitHub 图床 的解决方案,目前来看是比较理想的,因此记录如下。其好处就是结合了本地存储不会出现图床失效、加载缓慢等问题,又能方便地上传生成网络图片链接版本方便输出到其他的平台。
另外,趁此机会总结了一下自己使用 Markdown 的场景,以及使用规范,比较个人向,若是没有兴趣的可以直接跳转到第三部分阅读。
Markdown 应用场景
进入大学以来,事实上自己记录文字的经验完全经历一场电子化的转变。因此,首先来整理一下自己使用 Markdown 的需求:
在进入大学以前,书写问题的场景有二:1. 个人记录;2. 学习笔记。前者主要是放在一个专门的本子上,而后者的呈现形式则是各种笔记本。在当时的学习场景下,自己还没有整理、输出文字的习惯,所以出现的问题可能 ...
Windows 新开始
安装 Windows
微 PE 安装
用的是微 PE,相对来说最为省心的一种安装方式了
若是第一次安装建议全文阅读 http://www.wepe.com.cn/ubook/,没啥好说的,但若是第一次尝试的话总会心慌慌;
下载源&版本问题
最推荐的自然是从官网下载,不过有速度的问题;这就涉及了第三方的下载,不推荐直接从不明的百度云等渠道下载,自己在用 https://msdn.itellyou.cn/
其实困扰最多应该是 win 的版本问题,教育版不要装了,但其他专业版或是企业版等的问题就众说纷纭了
之前用过专业版,可能是来源的问题不是很纯净,系统体验一般,例如说自带应用商店等,会带一些基本的软件,例如自带的 Onenote;
现在用的是企业版,直观感受就是很自由,然后也没有应用商店、Onenote 等,很纯净
「操作系统-Windows 10 Enterprise LTSC 2019」,选择最新的相应版本即可,我用的是 「Windows 10 Enterprise LTSC 2019 (x86) - DVD (Chinese-Simplified)」
关闭 Windo ...
Ubuntu 笔记
2020-05-20 更新
关于如何删除双系统中的 Ubuntu,参考 如何科学卸载 Ubuntu? 。只需要用 EasyUEFI企业破解版 v3.2 删除 Ubuntu 启动引导,之后再删除系统分区即可。
Linux平台常用软件总结(Ubuntu版)
Linux基础:利用SSH上传、下载(使用sz与rz命令)
那个程序员的 Linux 常用软件清单 | Linux 工具篇
Ubuntu 安装后的配置及美化(一)
Ubuntu 安装后的配置及美化(二)
【这里太混乱了,主体部分是大二上 ICS 课程之后对于 Linux 心向往之开始的一些尝试,然而 Surface 上双系统使用总是体验欠佳;再之后到了大三入手 MBP,从此投入 macOS 怀抱,甚至一并丢弃了 Windows,对于 Linux 也就兴致缺缺;再到了大三下半学期由于 分布式系统 课程的需要又简单安装了 Ubuntu,就是下面这一部分的记录,所以思路应该要稍微清晰些;但总体上文章一片混乱,留待日后整理吧~】
软件安装 & 基本配置
由于课程需要,重新安装一次双系统,因此重新记录一下 Ubuntu 的配置方案。 ...
概率论基础(四)随机变量的数学特征
心血来潮填了好久之前埋下的坑,虽然感觉还是有点潦草;不过反正这些东西日常也是会用到的,之后及时更新吧~
这部分内容包括
数学期望
方差
Markov 不等式
协方差和相关系数
协方差阵
随机变量的数学期望
这里仅仅给出一些定义、常用的性质的介绍;在实际应用中,更为常用的是各中分布,要记住它们的分布、期望、方差等性质,更重要的是会推导的过程;在此不列出,在下面的链接中给出了较为全面的推导:常用概率分布的矩母函数、特征函数以及期望、方差的推导
一元情况下略,注意按照定义期望存在需要满足绝对可积,是为了保障期望这个积分有明确的数学意义。下面仅给出随机向量的数学期望:
定理:设 \(X=(X_1,...X_n)\) 是随机向量,若 X 有联合 pdf,以及实函数 \(g(X)\) 使得 \[
\int_{\mathbb{R}^n}|g(\mathbf x)|f(\mathbf x)d\mathbf x<\infty
\] 则 \(Y=g(\mathbf x)\) 有数学期望 \[
E(Y)=\int_{\mathbb{R}^n}g(\mathbf x)f(\mathb ...
概率论基础(三)随机向量
由于疫情在家,之间参考的陈老的那本教材留在学校了,所以从这部分开始主要参考了北大李东风教授的公开讲义,见 http://www.math.pku.edu.cn/teachers/lidf/course/probstathsy/probstathsy.pdf 。因此也对于笔记结构稍做了些调整。
这部分主要包括
随机向量的概念
离散随机向量
连续随机向量
随机向量函数的分布
条件分布
随机向量
随机向量 \((X,Y)\)
联合概率分布 \(F(x,y)=P(X\le x,Y\le y)\)
边缘分布 \(F_X(x)=P(X\le x,Y\le\infty)=F(x,\infty)\)
随机向量,或者说是向量之间的独立性:对于事件我们已经定义过了其独立性,显然为了自洽我们需要根据事件的独立性来进行定义。对于 \(\forall x,y\) ,事件 \(\{X\le x\}, \{Y\le y\}\) 独立,则称随机变量 X 和 Y 独立。显然,对于这个定义,我们用概率的形式写出来就是 \[
P(X\le x,Y\le y)=P(X\le x)P(Y\le y)\tag{1.1 ...
Hackintosh 入门+软件配置+个人向软件推荐
近期新配了套 PC,也勉勉强强装上了 Catania10.15.4,算是正式踏入了黑苹果的大门。 从安装开始,到全新的软件配置,折腾了整整两天,把过程都记录在这里,下面也包括自己安装的软件,重要的是相关配置,避免之后可能出现的重装机/更换设备时候的浪费时间。
所以本文的性质,应该是个人存档,本不该发出来;但考虑到自己零零散散写了也有近万字,其中包含了众多的资源链接,本身具有较大的容量,同时出现的一些问题也可能是常见的,因此有兴趣的话可以参看;然而,这里毕竟都是个人的配置,也不免存在诸多谬误,直接套用显然是不可取的,这也是我为什么在其中添加了无数🔗的原因,请在配置/安装软件时阅读参考链接并自行查阅官方材料,祝阅读愉快~
你可以看到
入门版安装 Hackintosh
如何进行 USB 定制
支持蓝牙和 Airdrop
支持 Handoff
macOS 个性化配置:原则是简明有效
个人向的软件推荐
相关软件使用/配置的建议
黑苹果资源链接
综合
黑苹果(hackintosh)技术整合指南 知乎上的一套整合资源
sleele 博客的黑苹果部分
黑果小兵的部落格 https://blo ...
CMD 命令笔记
【这里完全是对于下文的摘录,虽然感觉之后使用 Windows,尤其是 CMD 的机会已经很少了。】
Windows 用户需要知道的 CMD 常用命令总结
打开 CMD
方法一:开始菜单 -> Windows 系统 -> 命令提示符。
方法二:按下快捷键 Win + R 打开运行,输入 cmd 回车。
方法三:点击任务栏搜索按钮,搜索 cmd 并打开。
方法四:在资源管理器的地址栏输入 cmd 并回车,cmd 打开后会自动定位到当前目录。
方法五:右键点击开始菜单的 Win 图标 -> 命令提示符。
每条命令输入后,回车运行。命令正确则执行完毕后回到 > 状态;命令错误返回错误信息。
关机、重启、注销、休眠、定时
关机:shutdown /s
重启:shutdown /r
注销:shutdown /l
休眠:shutdown /h /f
取消关机:shutdown /a
定时关机:shutdown /s /t 3600(3600 秒后关机)
目录操作
切换目录,进入指定文件夹:
切换磁盘:d:(进入 d 盘)
切换磁盘和目录:cd /d d:/te ...
Terminal 配置+美化 iTerm + zsh
基本配置
终端软件用 iTerm2 https://iterm2.com/
shell 用 zsh,macOS 默认
cat /etc/shells 查看有哪些,echo $SHELL 查看用的是哪个解释器
更改 shell 指令 chsh -s /bin/zsh
配合用 oh-my-zsh https://ohmyz.sh/
GitHub https://github.com/ohmyzsh/ohmyzsh
1234# 安装sh -c "$(curl -fsSL https://raw.github.com/ohmyzsh/ohmyzsh/master/tools/install.sh)"# 卸载uninstall_oh_my_zsh
很多人用的 powerline https://github.com/powerline/powerline
是啥?「Powerline is a statusline plugin for vim, and provides statuslines and prompts for several other appli ...
课程作业:关于「Twitter 上的政治同质性」的两篇论文之评述
2020-04-02
以 Echo Chamber 为关键词在 Google Scholar 中进行搜索,筛选了其中的 Echo Chamber or Public Sphere? Predicting Political Orientation and Measuring Political Homophily in Twitter Using Big Data 和 Tweeting From Left to Right: Is Online Political Communication More Than an Echo Chamber? 两篇论文阅读,它们分别于2014 年和 2015 年被发表在 Journal of communication 及 Psychological science 上,两篇论文研究的对象都围绕着 Twitter 上的政治同质性,在研究内容和研究方法上有相似性。
Echo Chamber or Public Sphere? Predicting Political Orientation and Measuring Political Homop ...
NAS + 搭建 Chevereto 图床 & Typora 上传指南
在 Markdown 新解决方案:Typora+本地备份+GitHub 图床 中,我给出的 Markdown 图片管理方案是采用本地备份加上 GitHub 同步的思路;简言之,为了保证图片的安全性采用了本地存储,需要进行分享的话将其中的图片连接改为 GitHub 图床,这种方案在稳定性上表现得很好,但是操作上到底还是有些繁琐(需要手动上传图片,并运行链接替换的代码)。
疫情在家,这样的方案也十分有效,最近回了学校,重新用起了 NAS,于是参考这篇文章 http://guiu.xyz/p/ab70f304.html 【已失效】,配合 Chevereto 探索了一套新的方案;相较于之前的那种,这里的优势在于配合代码实现了图片的自动上传,因此可以直接分享;但与此同时带来的问题在于,服务依赖于图床的稳定性,由于是自用的 NAS 所以相对来说还是可以的,用了一个多月下来体验不错(域名选择的话,直接用了 Synology 免费的那个 id.synology.me 还是比较可靠的)。
【20201119 更新:目前以全面转向 MWeb,参见 MWeb 入门指南】
搭建 Chevereto 图床
图 ...
NAS + 域名申请实现外网访问群晖
【这也是一篇旧文存档,当时买了一年的域名也已经到期;当时还没有学计算机网络所以对于整个流程也是一知半解,但按照这些教程磕磕绊绊也算是实现了,因此记录如下;现在建站转向了 CNblog,而其他的日常使用则是直接用了群晖自带的 DDNS,速度不是很快,不过就目前的需求来说也是 OK 的了。】
外网访问群晖有很多种方法:
群晖本身有个QuickConnect,但貌似很多人反映访问速度不快,不知道现在这个问题解决了没。方案即是输入 username.quickconnect.to 或者 quickconnect.to/username; 实测在内网环境下会连接到内网的机器地址,而在外网下则是连接到 domain:5001 (如果已绑定域名的话);
群晖还有个 EZ-internet,貌似是自动设置转发还是什么,和自己设置DDNS的作用是一样的,比自己设置方便,但支持的路由器有限。
DDNS。1. 群晖自带有 DDNS—> id.synology.me;2. 花生壳 DDNS;3. 自己申请域名作 DDNS,也是这里采用的方法
准备工作:公网 IP,申请域名
拥有公网IP是采用DDN ...
NAS + 影音方案总结
【是 2019 年 11 月刚入手 Synology 时期的记录,目前使用已经发生了一些变化,仅供存档之用。】
Film: Plex+Infuse
Plex: 为你的所有设备打造一个聚合影音中心:https://sspai.com/post/45414
Video Station, DS Video:官方的套件,优势在于其稳定性,而缺点有:匹配功能较差,主要是基于文件名的匹配,因此很多影片的信息缺失。对于强迫症来说,这样的缺点当然是无法接受的。
Plex:偶然发现这样一个强大的聚合平台,基于网络的视频、图片、音乐库,功能非常强大。先讲缺点:1. 影片的中文匹配能力较弱;2. 定价偏高。移动端似乎有直连功能,但无论如何还是失败,购买 Plex Pass 才能解锁基于网络的播放时限,但是价格昂贵,终身要近 1000 元。 -Infuse:最终的方案,电脑端可以使用 Plex 的网络播放功能(在线或者客户端);手机上则安装了 infuse 进行观看,注意其可以直接连接 Plex 账号,可以说很贴心了。
Audio: DS Audio
Audio Station, DS Audio:默 ...