thinklive

dirichlet library

苏大部分

概念

软件可以粗略分为系统,工具,应用
软件的发行模式有:

  • 商业软件
  • 共享软件,免费给用户使用的商业软件,比如入门版杀毒软件,不一定开源
  • 开源软件,开放源代码的软件,但不代表用户有自由分发修改源代码的权力
  • 自由软件,开源,任何用户都有权使用、拷贝、扩散、修改该软件,但有义务公布修改后的代码

Linux系统提供多个虚拟控制台(默认6个字符界面,1个图形界面),可以独立使用,自由切换

阅读全文 »

实践报告

背景介绍

本次作业使用一个房价数据集,房价数据集完全由数字信息构成,规模属于中小级别(2w条左右),有一定的数据处理需求,但由于最主要的参数房价和其他相关列主要是简单的类线性关系,易于作为学习数据科学的入门材料。
此外,通过房屋参数来预测房价在现实中也有一定的实践意义,例如一些房屋出售软件可以建立相关模型来给出估价等。

问题描述

主要目标是预测房价,为此目标,需要清洗不合理的数据,寻找线性相关的列,最后利用一些回归模型来进行训练,并验证结果 最后的输入是数据集内和房价线性相关程度较高的列,输出则是对房价的预测结果。

数据描述

这些数据涉及在加州某个地区的街区以及基于 1990 年人口普查数据的一些汇总统计数据:

  1. 房屋中位价值:一个街区内家庭的房屋中位价值(以美元计算)
  2. 收入中位数:一栋房屋内的家庭收入中位数(以万美元衡量)
  3. 中位年龄:街区内房屋的中位年龄; 数字较小的是较新的建筑
  4. 房间总数:一个街区内的房间总数
  5. 卧室总数:一个街区内的卧室总数
  6. 人口:居住在一个街区内的总人数
  7. 家庭:一个街区的家庭总数
  8. 纬度:衡量房屋向北有多远的指标; 值越高越北 [°]
  9. 经度:衡量房屋向西有多远的量度; 数值越高,越西 [°]
  10. 距离海岸:到最近海岸点的距离[m]
  11. 到洛杉矶的距离:到洛杉矶市中心的距离[m]
  12. 到圣地亚哥的距离:到圣地亚哥中心的距离[m]
  13. 到圣何塞的距离: 到圣何塞中心的距离 [m]
  14. 到旧金山的距离:到旧金山市中心的距离[m]
  1. Median House Value: Median house value for households within a block (measured in US Dollars)
  2. Median Income: Median income for households within a block of houses (measured in tens of thousands of US Dollars)
  3. Median Age: Median age of a house within a block; a lower number is a newer building [years]
  4. Total Rooms: Total number of rooms within a block
  5. Total Bedrooms: Total number of bedrooms within a block
  6. Population: Total number of people residing within a block
  7. Households: Total number of households, a group of people residing within a home unit, for a block
  8. Latitude: A measure of how far north a house is; a higher value is farther north [°]
  9. Longitude: A measure of how far west a house is; a higher value is farther west [°]
  10. Distance to coast: Distance to the nearest coast point [m]
  11. Distance to Los Angeles: Distance to the centre of Los Angeles [m]
  12. Distance to San Diego: Distance to the centre of San Diego [m]
  13. Distance to San Jose: Distance to the centre of San Jose [m]
  14. Distance to San Francisco: Distance to the centre of San Francisco [m]
阅读全文 »

hw1

时间复杂度分析

对这种形式的函数可以这样比较

\[f_1=n^{\sqrt{n}}=(2^{lgn})^{\sqrt{n}}\] \[f_2=n^{10}.2^{n/2}=2^{lg(10n)+n/2}\]

复杂度计算

对于T(n,n): T (x, y) = Θ(x + y) + T (x/2, y/2). 化成

得到θ(n)

阅读全文 »

notebook

  1. Ctrl + Return(或者 Cmd + Return在 Mac 上): 评估当前单元格
  2. Shift + Return评估当前单元格并移至下一个单元格
  3. ESC命令模式 (在使用以下任何命令之前可能需要按)
  4. a: 在上面创建一个单元格
  5. b在下面创建一个单元格
  6. dd: 删除一个单元格
  7. z撤消上一次单元格操作
  8. m将单元格转换为 Markdown
  9. y将单元格转换为代码
    阅读全文 »

Numpy 是 Python 中科学计算的核心库。 它提供了高性能的多维数组对象以及使用这些对象的工具 数组。

数组

numpy 数组是一个值网格,所有值都具有相同的类型,并由非负整数组成的元组索引。 它的维度就是数组的秩 ;它的shape就是每个维度的大小组成的元组

阅读全文 »

shell脚本

Shell 脚本通常以 shebang 行开头:#!path/to/interpreter。

#!是一个人类可读的 幻数表示 0x23 0x21它可以告诉 shell 将文件其余部分的执行传递给 指定翻译。 如果您的脚本作为可执行文件运行(例如 ./awesome_shell_script) 加上 shebang 行,那么 shell 将调用 可执行文件(通常是解释器)位于 path/to/interpreter运行你的 脚本。 如果您的脚本作为参数传递给解释器,例如 bash awesome_shell_script,那么 shebang 没有效果并且 bash会处理 脚本的执行。

阅读全文 »

泰特斯

正如童话故事常见的开头一样,泰特斯是个贫穷而有志气的青年,有一天当他在王国的大街上闲逛时,他遇到了公主的轿子,年轻的泰特斯对美丽淑慧的公主一见钟情,他下定决心一定要当上王国的驸马爷。

阅读全文 »

python语言特性

函数

名称也可以与函数绑定。例如,名称 max 就和我们之前使用的 max 函数进行了绑定。与数字不同,函数很难以文本呈现,因此当询问一个函数时,Python 会打印一个标识来描述:

阅读全文 »

c++特性

  • 更好的C C++支持命令式编程,一种编程风格,其中程序按顺序执行的命令序列。从这个意义上讲,C++ 可以看作是对C 编程语言,使日常命令式编程更加直观和更容易使用。课程阅读器的这一部分介绍了一些 C++ 最常用的库,包括标准模板库,并展示了如何使用这些库来构建命令程式。 此外,它探索了最初出现在 C++ 语言中的新原语。C 编程语言,即指针、C 字符串和预处理器。
    阅读全文 »
0%