-
视觉表现理论知识介绍
终于可以知道视觉表现的实现方式,而不是一个一个的具体实现了,突然感到自己能够把握页面的整体布局了呢,似乎学到了表现背后的东西?以下是一个突然发现自己见识如此少的女汉子的嘶吼啊啊啊,刚刚注意到width设置的是内容区的宽度,增加 padding 或 margin 后会增加总体宽度啊啊啊啊,今天才知道只有内容区和左右外边距可以设置为 auto !!!! 1 相关术语流 : 所有元素都被放置在流中, 页…- 1
- 0
-
html的基础 理论
本篇文章给大家分享的是关于html基础 理论知识,内容很不错,有感兴趣的朋友可以看一下HTML语义化HTML标签的语义化是指:通过使用包含语义的标签(如h1-h6)恰当地表示文档结构css命名的语义化是指:为html标签添加有意义的class为什么需要语义化:立即学习“前端免费学习笔记(深入)”;去掉样式后页面呈现清晰的结构盲人使用读屏器更好地阅读搜索引擎更好地理解页面,有利于收录便团队项目的可持…- 1
- 0
-
速度提高40w倍,牛津新的ML策略计算蛋白的自由能扰动,助力药物发现
编辑 | 白菜叶机器学习为快速准确地预测结合亲和力提供了巨大的希望。然而,目前的模型缺乏稳健的评估,无法完成(命中到)先导化合物优化中遇到的任务,例如对一系列同类配体的结合亲和力进行排序,从而限制了它们在药物发现中的应用。牛津大学的研究团队首先提出了一种新的基于注意力的图神经网络模型 AEV-PLIG(原子环境向量-蛋白质配体相互作用图),以解决这些问题。其次,他们提出了一种新的、更真实的分布外测…- 2
- 0
-
无需侵入,一键重构细胞「电活动」,AI革新药物心脏毒性评估
利用ai重建细胞内动作电位:基于纳米电极阵列的深度学习方法细胞内电生理学在神经科学、心脏学和药理学研究中至关重要,它能揭示细胞的电特性。纳米电极阵列(NEA)技术通过同时高通量记录细胞内和细胞外动作电位(iAP和eAP),为传统方法提供了极具潜力的替代方案。尽管利用NEA获取细胞内电位仍存在挑战,但斯坦福大学和加州大学的研究团队开发了一种AI辅助技术,该技术利用NEA上干细胞衍生心肌细胞的数千个同…- 2
- 0
-
耶鲁、剑桥等开发MindLLM,将脑成像直接转换为文本
编辑 | 萝卜皮将功能性磁共振成像 (fMRI) 信号解码为文本一直是神经科学界面临的一项重大挑战,它有望推动脑机接口的发展,并加深对大脑机制的了解。然而,现有的方法往往存在预测性能不佳、任务种类有限以及跨受试者泛化能力较差等问题。针对这一问题,耶鲁大学(Yale University)、达特茅斯学院(Dartmouth College)和剑桥大学(University of Cambridge)…- 2
- 0
-
首个强化生成模型AbNovo实现多目标、多约束抗体从头设计,发表于ICLR 2025
上海交大医学院张海仓课题组联合中原人工智能产业技术研究院及中科院计算所,研发出一款名为abnovo的创新抗体设计工具。该工具巧妙地结合强化学习和深度扩散模型,能够在多重目标和约束条件下,高效完成抗体从头设计。这项研究成果已发表于国际顶级机器学习会议iclr 2025,论文标题为“multi-objective antibody design with constrained preference …- 2
- 0
-
ByteQC:通往大规模实用化量子化学计算的曙光
字节跳动研发并开源了基于gpu加速的大规模量子化学计算工具集byteqc,显著提升了量子化学计算效率。该工具集针对真实化学体系中大量微观粒子的精确计算难题,利用gpu强大的算力,大幅加速了常用量子化学算法,并结合量子嵌入方法,在“黄金标准”精度下模拟大规模量子化学体系。ByteQC的核心优势在于其高效的GPU实现和创新的算法策略。在硬件层面,它巧妙地利用了NVIDIA的cuTENSR/cuTENS…- 2
- 0
-
为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理
深度解析:大模型的自我改进能力为何参差不齐?斯坦福大学最新研究揭秘近期,斯坦福大学的一项研究深入探讨了大型语言模型(LLM)自我改进能力背后的机制,解释了为何有些模型能够有效利用额外计算资源提升性能,而另一些则停滞不前。该研究的核心在于模型的初始“认知行为”。研究人员选取了Qwen-2.5-3B和Llama-3.2-3B两个模型进行对比,利用强化学习训练它们解决Countdown数学游戏。结果显示…- 2
- 0
-
OPPO 即将行业首发 5.5G 技术 理论可实现 10 倍连接速率提升
3 月 28 日,oppo find 系列产品负责人周意保在微博发文,表示 oppo 已经进入了 5.5g 时代。OPPO Find X7 系列周意保在微博上传了一张截图,图中的手机锁屏界面右上方状态栏信号一栏显示为 5GA,也就是人们更加熟悉的 5.5G。此外,周意保也发文称:" 和大家一起进入 5.5G 新移动网络时代!" 宣布了 5.5G 新移动网络时代的到来。OPPO …- 3
- 0
-
Django编程:从理论到实际的完整指南
django是一个开源的web应用程序框架,它使用python语言编写。自从发布以来,它已经成为了开发高质量web应用程序的首选框架之一。本文将向您介绍Django的基础知识,包括从理论到实际的完整指南。我们将涵盖以下内容:Django的背景和发展历程Django的基础知识Django的MVC架构和MTV架构Django的路由系统和视图Django的模板系统Django的表单处理Django的数据…- 3
- 0
-
从概念到应用,清华团队开发DeepTFBU工具包助力基因表达精准调控
编辑 | 萝卜皮增强子通过与转录因子 (TF) 相互作用,在各种生物过程中充当基因表达的关键调节器。虽然转录因子结合位点 (TFBS) 被广泛认为是 TF 结合和增强子活性的关键决定因素,但其周围背景序列的重要作用仍有待定量表征。清华大学的研究团队提出了转录因子结合单元(transcription factor binding unit,TFBU)概念,通过使用深度学习模型量化 TFBS 周围上下…- 4
- 0
-
慢思考助力医学大语言模型突破数据瓶颈:上海交大联合上海AI Lab推出MedS3系统
上海交通大学、复旦大学和上海人工智能实验室的研究团队推出新型医学推理系统meds3,该系统采用自我进化“慢思考”范式,无需预训练和模型蒸馏,即可实现细粒度推理流程验证。MedS3克服了现有医疗推理模型在长链推理和数据效率方面的不足。现有模型通常依赖于医疗考试题上的模型蒸馏,忽略了推理过程的可验证性和医疗任务的全面覆盖。而MedS3通过策略模型和过程奖励模型(PRM),结合蒙特卡洛树搜索(MCTS)…- 4
- 0
-
清华大学AIR联合水木分子开源DeepSeek版多模态生物医药大模型BioMedGPT-R1
编辑 | ScienceAI2025 年初,DeepSeek给全球引发了 AI 大模型的新一轮热议。多家市场咨询公司指出,在 DeepSeek 的影响下,从大模型供应商到基础设施和平台供应商的整个 AI 产业生态都掀起了一波「新浪潮」。 DeepSeek R1 以其强大的推理能力,为各行各业带来了智能化升级新机遇。而生物医药领域,也正在迎来它的 DeepSeek 时刻。2025 年 2 月 20 …- 3
- 0
-
Code Llama代码能力飙升,微调版HumanEval得分超越GPT-4,一天发布
昨天,Meta 开源专攻代码生成的基础模型 Code Llama,可免费用于研究以及商用目的。Code Llama 系列模型有三个参数版本,参数量分别为 7B、13B 和 34B。并且支持多种编程语言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。Meta 提供的 Code Llama 版本包括:代码llama,基础代码模型;代码…- 3
- 0
-
OPPO提出GlyphDraw:一键生成带汉字图像,扩散模型输出表情包
近年来,文本生成图像领域取得了许多令人惊讶的突破,许多模型都能够根据文本指令创建高质量和多样化的图像。尽管生成的图像已经非常逼真,但目前的模型通常擅长生成风景、物体等实物图像,而难以生成具有高度连贯细节的图像,例如带有汉字等复杂字形文本的图像为了解决这个问题,来自OPPO等机构的研究者们提出了一个名为GlyphDraw的通用学习框架。该框架的目标是让模型能够生成嵌入连贯文本的图像。这项工作是图像合…- 3
- 0
-
从个体对抗到流形对抗:CVPR 2023探索可泛化的流形对抗攻击
声称准确率 99% 的人脸识别系统真的牢不可破吗?事实上,在人脸照片上做一些不影响视觉判断的改变就可以轻松攻破人脸识别系统,例如让邻家女孩和男明星被判断成同一个人,这便是对抗攻击。对抗攻击的目标是寻找自然的且能够让神经网络混淆的对抗样本,从本质上讲,找到对抗样本也就是找到了神经网络的脆弱之处。近日,来自东方理工的研究团队提出了一种广义流形对抗攻击的范式(Generalized Manifold A…- 3
- 0
-
ACM MM 2023 | DiffBFR: 美图&国科大联合提出的噪音抑制人脸修复方法
盲人脸恢复(blind face restoration, bfr)的目标是从低质量的人脸图像中恢复高质量的人脸图像。这是计算机视觉和图形学领域的一项重要任务,在监控图像修复、老照片修复和人脸图像超分辨率等多种场景中得到广泛应用然而,这个任务非常具有挑战性,因为不确定性的退化会损害图像的质量,甚至会导致图像信息的丢失,比如模糊、噪声、下采样和压缩伪影等问题。以前的BFR方法通常依赖于生成对抗网络(…- 3
- 0
-
复旦大学团队发布中文医疗健康个人助手,同时开源47万高质量数据集
随着远程医疗的兴起,患者越来越倾向于选择在线问诊和咨询,以寻求便捷高效的医疗支持。最近,大型语言模型(llm)展示出了强大的自然语言交互能力,给健康医疗助手走进人们的生活带来了希望医疗健康咨询场景通常较为复杂,个人助手需要有丰富的医学知识,具备通过多个轮次对话了解病人意图,并给出专业、详实回复的能力。通用语言模型在面对医疗健康咨询时,往往因为缺乏医疗知识,出现避而不谈或者答非所问的情况;同时,倾向…- 3
- 0
-
手机摄影技术让以假乱真的好莱坞级电影特效视频走红
一个普通人用一台手机就能制作电影特效的时代已经来了。最近,一个名叫 Simulon 的 3D 技术公司发布了一系列特效视频,视频中的 3D 机器人与环境无缝融合,而且光影效果非常自然。呈现这些效果的 APP 也叫 Simulon,它能让使用者通过手机摄像头的实时拍摄,直接渲染出 CGI(计算机生成图像)特效,就跟打开美颜相机拍摄一样。在具体操作中,你要先上传一个 3D 模型(比如图中的机器人)。S…- 3
- 0
-
背景与前景控制更加精细,编辑更加快捷:BEVControl的两阶段方法
本文将介绍一种通过bev sketch布局来精确生成多视角街景图片的方法在自动驾驶领域,图像合成被广泛应用于提升下游感知任务的性能在计算机视觉领域,提升感知模型性能的一个长期存在的研究难题是通过合成图像来实现。在以视觉为中心的自动驾驶系统中,使用多视角摄像头,这个问题变得更加突出,因为有些长尾场景是永远无法收集到的根据图1(a)所示,现有的生成方法将语义分割风格的BEV结构输入生成网络,并输出合理…- 3
- 0
-
微软亚洲研究院推出TinyMIM:通过知识蒸馏提升小型ViT的性能
重新表达:研究动机掩码建模(MIM, MAE)被证明是非常有效的自监督训练方法。然而,如图 1 所示,MIM 对于更大的模型效果相对更好。当模型很小的时候(比如 ViT-T 5M 参数,这样的模型对于现实世界非常重要),MIM 甚至可能一定程度上降低模型的效果。比如用 MAE 训练的 ViT-L 比普通监督训练的模型在 ImageNet 上的分类效果提升 3.3%,但是用 MAE 训练的 ViT-…- 4
- 0
-
北航打破模态壁垒,跨可见光-红外模态的通用物理对抗攻击方法来了
近年来,针对视觉感知系统安全性评估的探索逐步深入,先后有研究者成功实现基于眼镜、贴纸、衣服等不同载体的可见光模态安全评估技术,也有一些针对红外模态的新尝试。但是它们都只能作用于单一模态。随着人工智能技术的发展,可见光 - 热红外成像技术已同时应用于治安监控、自动驾驶等诸多安全关键任务中,其中可见光成像可以在白天提供丰富的纹理信息,红外成像则可以在夜间清晰显示目标的热辐射分布,二者结合更为视觉感知系…- 3
- 0
-
「场景控制传送门:四合一物体传送,上交&蚂蚁出品」
在常见的图像编辑操作中,图像合成是指将一张图片的前景物体与另一张背景图片结合,生成一张合成图的过程。合成后的图像在视觉效果上类似于将前景物体从一张图片传送到另一张背景图片上,如下图所示图像合成在艺术创作、海报设计、电子商务、虚拟现实、数据增广等领域被广泛使用通过简单的剪切粘贴得到的合成图可能会存在很多问题。在之前的研究工作中,图像合成衍生出不同的子任务,分别解决不同的子问题。举例来说,图像混合旨在…- 3
- 0
-
DeepMind发现,向大型模型传达「深呼吸,一步一步来」的提示方法极为有效
本文提出了一种简单而有效的方法 OPRO,其利用大型语言模型作为优化器,优化任务用自然语言描述就可以,优于人类设计的提示。优化对于所有领域都至关重要。 有些优化是从初始化开始的,然后迭代的更新解以优化目标函数。这种优化算法通常需要针对单个任务进行定制,以应对决策空间带来的特定挑战,特别是对于无导数的优化。接下来我们要介绍的这项研究,研究者另辟蹊径,他们利用大型语言模型 (LLM) 充当优化器,在各…- 3
- 0