thinklive

dirichlet library

欢迎来到迪瑞克拉

这里是thinklive的个人博客,不定时地会发一些个人技术学习心得和生活体会,申请友链可邮件联系
使用左侧的分类来定位内容
为了响应环保号召,并且给你的电脑省点电,推荐禁止浏览器的js功能,例如firefox浏览器可下载disable javascript插件禁用js
这意味着该网站的动态功能全部瘫痪,包括背景动效,加密页面,左侧的时钟,游戏等页面,但浏览普通博文的功能保持正常
可以通过左下角的"🌓"按钮切换白天/黑夜模式(功能测试中)
有时可能出现latex数学公式不渲染的bug,这时一般刷新页面就可以解决

建站指北

菜单的资源地图神龛是迪瑞克拉子站,分别用于存放资源网站和随笔,主站主要存放学习笔记或者一些公开的创作

迪瑞克拉的由来

狄利克雷函数(英语:dirichlet function)是一个定义在实数范围上、值域不连续的函数。狄利克雷函数的图像以Y轴为对称轴,是一个偶函数,它处处不连续,处处极限不存在,不可黎曼积分。这是一个处处不连续的可测函数。

在我看来它象征着混沌,不可知与无限的可能性,狄利克雷换一种方式音译就成了迪瑞克拉

更新日志

阅读全文 »

基础知识

html

浏览器在获取到http文档后,根据所需要的资源依次发送请求
响应头Response headers告诉我们,例如,响应的字节大小,以及响应的确切时间
文档对象模型Document Object Model,或DOM,是一个应用编程接口(API),它能够对与网页相对应的元素树进行程序化修改

阅读全文 »

计算机安全常识

账户安全

美国国家标准与技术研究院(NIST)的建议:

  • 密码长度应至少为八个字符
  • 验证者应规定所有打印的 ASCII 字符和 Unicode 符号的长度最多为 64 个字符
  • 验证者应该将预期的密码与可用的字典单词、重复序列、被破坏的密码列表和上下文特定的单词进行比较
  • 验证者不应允许未经身份验证的用户访问密码提示
  • 验证者不应要求定期更改密码
  • 验证者应限制失败的身份验证尝试次数并锁定潜在的攻击者
阅读全文 »

縺ォ縺ッ繧「繝ェ繧ケ縺励
阅读全文 »

基础概念

强化学习和监督学习的区别:

  1. 强化学习输入的样本是序列数据,监督学习的样本之间相互独立
  2. 没有明确的监督者,通过奖励机制进行学习,但回馈可能是长期的,模糊的

一些强化学习的演示视频中,ai会做一些人类看来无意义的动作,正是这种“玄学”的回馈机制导致的

  • actor: 行为主体
    • action则可分为离散和连续,例如2d游戏中走格子迷宫就是一个典型的离散动作空间
  • observaton o /states s: 观测与状态
    • 观测到的情况o和现实情况(状态s)其实有可能不同,假设可以观察到全景,rl则成为一个马尔科夫决策过程
  • policy π: 行为策略
    • 带有参数θ
  • reward:反馈
    • baseline: 避免总是正值的reward,增加的偏置值,例如取期望
  • episode: 一轮行动
  • trajectory τ: \(\tau=\{s_{1},a_{1},s_{2},a_{2},\cdots,s_{T},a_{T}\}\)
  • 折扣γ: 直觉上,最开始的训练回馈可能更重要,越往后则训练收益越小,所以对每步的回馈可以乘以一个 \(\gamma^{t-1}\),t为训练次数,这个超参数也可以用于控制训练策略偏短期还是偏长期
阅读全文 »

专业课

网络

USP是一个智能化的网络数据库统一检索平台。它通过一个统一界面帮助用户在多个网络数据库搜索平台中实现信息检索操作,是对外网络中的多种检索工具的智能化整合
NAT即网络地址转换(Network Address Translation),是一种将IP数据包中的IP地址转换为另一个IP地址的技术

  1. 静态NAT
    • 功能:实现内部IP与公网IP的一对一固定映射,常用于需要公网访问的服务器(如Web服务器),确保外部可通过固定公网IP访问内部设备
  2. 动态NAT
    • 功能:从定义的公网IP地址池中动态分配IP,内部设备随机获取公网IP,用完后释放,适用用户数不固定的场景
  3. 端口地址转换(PAT/NAPT(Network Address Port Translation,网络地址端口转换))
    • 功能:多个内部IP共享一个公网IP,通过端口号区分不同连接,极大节省IP地址,是家庭、企业最常用的NAT方式
阅读全文 »
0%